계급의 크기

도수분포표에 대해서 알아봤어요. 여러 개의 자료로 표를 만들면 자료의 위치나 흐름 등을 쉽게 파악할 수 있는 장점이 있어요.

이번 글에서 공부할 히스토그램은 도수분포표에서 한 발 더 나가서 표가 아니라 그림으로 그리는 거예요. 그림이 글자보다 직관적이고 이해하기가 쉽잖아요.

히스토그램이 무엇인지, 히스토그램을 어떻게 그리는지 알아보죠.

히스토그램

도수분포표는 아래 표처럼 생겼어요. 왼쪽 칸에는 계급을 쓰고 오른쪽 칸에는 도수를 적지요. 제일 아랫줄에는 도수의 총합을 적어요.

아래는 도수분포표 만드는 법에서 사용한 수학 점수를 도수분포표로 나타낸 거예요.

점수(점) 학생 수(명)
60 이상 ~ 70 미만 1
70 ~ 80 3
80 ~ 90 10
90 ~ 100 6
합계 20

이 도수분포표의 왼쪽에 있는 계급을 가로축에, 오른쪽 칸에 있는 도수를 세로축에 표시해서 직사각형 모양으로 나타낸 그래프가 바로 히스토그램이에요.

히스토그램으로 그리면 아래처럼 생겼어요.

히스토그램

히스토그램 그리는 방법

위에서 설명한 것처럼 히스토그램의 가로축에는 도수분포표에서의 계급의 양 끝값을, 세로축에는 도수를 써요. 눈금과 눈금 사이가 아닌 눈금선이 있는 부분에 계급의 양 끝값과 도수를 써야 해요.

그리고 실제 사용하는 계급 앞과 뒤에 한 칸씩을 더 만드세요.

각 계급을 가로로, 도수를 세로로 하는 직사각형을 그려요. 주의할 건 눈금에 다 채워서 그려야 해요. 옆의 직사각형과 바로 붙도록 그립니다. 아래 그림처럼 직사각형 사이가 서로 떨어져 있으면 안 돼요. 앞의 그림은 제대로 된 히스토그램, 아래 그림은 잘못된 히스토그램입니다.

잘못된 히스토그램

히스토그램의 특징

히스토그램은 그림(그래프)이므로 자료의 분포 상태를 도수분포표보다 좀 더 쉽게 알아볼 수 있어요. 글자보다 그림이 이해하기 쉬운 건 당연하잖아요.

히스토그램에서 한 계급의 직사각형의 넓이를 한 번 구해볼까요? 한 계급에서 가로의 길이는 계급의 크기와 같아요. 세로의 길이는 도수와 같죠. 그래서 직사각형의 넓이는 (계급의 크기) × (계급의 도수)가 되겠죠? 60점 이상 70점 미만의 직사각형의 넓이는 10 × 1 = 10, 70점 이상 80점 미만의 직사각형의 넓이는 10 × 3 = 30 이렇게 구할 수 있죠.

그런데 가로에 있는 계급의 크기는 계급이 달라도 모두 일정해요. 따라서 직사각형의 넓이는 도수에 비례해요.

다음이 중요한 내용인데요. 전체 직사각형의 넓이를 구해볼까요? 각각의 직사각형의 넓이를 다 더하면 되겠죠? 60점 이상 70점 미만은 10, 70점 이상 80점 미만은 30, 80점 이상 90점 미만은 10 × 10 = 100, 90점 이상 100점 미만은 10 × 6 = 60이죠. 10 + 30 + 100 + 60 = 200이네요.

이번에는 (계급의 크기) × (총 도수)를 구해볼까요? 10 × (1 + 3 + 10 + 6) = 10 × 20 = 200이에요. 위에서 구한 직사각형의 넓이와 같죠?

직사각형의 전체 넓이 = {(계급의 크기) × (도수)}의 총합 = (계급의 크기) × (총 도수)

아래 히스토그램을 보고 아래 물음에 답하여라.
(1) 계급값이 85점인 계급의 도수를 구하여라.
(2) 계급값이 95점인 계급의 직사각형의 넓이는 60점 이상 70점 미만인 계급의 직사각형의 넓이의 몇 배인가?
히스토그램

(1)에서 계급값이 85이므로 계급은 80점 이상 90점 미만이 되겠죠? 이 계급에서 막대의 세로가 도수니까 10이네요.

(2)는 계급값이 95점인 계급은 90점 이상 100점 미만인데, 이때의 도수는 6이에요. 60점 이상 70점 미만인 계급의 도수는 1이고요. 넓이는 도수에 비례한다고 했으니까 두 계급의 직사각형의 넓이를 비교할 때는 실제 넓이가 아닌 도수만 비교해도 돼요. 6/1 = 6이라서 넓이는 6배 입니다.

히스토그램과 막대그래프의 차이

히스토그램은 얼핏 보면 막대그래프와 닮았어요. 그런데 왜 막대그래프가 아닌 히스토그램을 그릴까요?

막대그래프는 보통 연속되지 않는 자료들을 그래프로 그릴 때 사용해요. 사과는 몇 개, 수박은 몇 개, 이럴 때 사용하죠. 수박과 사과는 서로 연결할 수 없잖아요.

히스토그램은 60 ~ 70점, 70 ~ 80점, … 처럼 서로 연속된 자료를 나타낼 때 사용합니다. 첫 번째 계급의 끝값인 70점과 두 번째 계급의 70점이 서로 연결되잖아요.

그래프를 보면 가장 눈에 띄는 게 있어요. 히스토그램은 막대가 서로 붙어 있고, 막대그래프는 벌어져 있어요. 위에서 설명한 연속이냐 연속하지 않느냐의 차이 때문에 생기는 건데요. 60 ~ 70, 70 ~ 80은 연속하니까 죽 붙여서 그려야 하는 거지요.

함께 보면 좋은 글

줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표 만드는 법
도수분포표에서의 평균구하기
도수분포다각형, 도수분포다각형 그리는 방법

정리해볼까요

히스토그램이란?

  • 도수분포표의 계급을 가로축에, 도수를 세로축에 표시하여 직사각형 모양으로 나타낸 그래프
  • 도수분포표보다 자료의 분포 상태를 한 눈에 알아볼 수 있다.
  • 직사각형의 전체 넓이 = {(계급의 크기) × (도수)}의 총합 = (계급의 크기) × (총 도수)
 
그리드형

도수분포표 만드는 법

2012. 7. 10. 12:30

도수분포표를 만드는 법을 공부해볼 거예요. 사실 도수분포표를 만드는 방법은 따로 공부하지 않아도 할 수는 있어요. 하지만 만드는 법을 공부하면 좀 더 체계적이고 더 많은 정보를 더 정확하게 줄 수 있는 도수분포표를 만들 수 있어요.

도수분포표를 만들기에 앞서 도수분포표에서 사용하는 용어들에 대해서 정확히 이해를 해야 해요. 혹시 이해되지 않는다면 도수분포표, 변량, 계급, 계급값, 도수를 한 번 읽어보세요.

도수분포표를 만드는 순서

  1. 주어진 자료에서 가장 큰 변량과 가장 작은 변량을 찾는다.
  2. 가장 큰 변량과 가장 작은 변량이 포함될 수 있는 계급을 만든다.
    계급은 OO 이상 ~ OO 미만이 되도록 하고, 계급의 크기가 모두 같아야 합니다.
    계급의 개수는 5 ~ 15개 정도가 적당해요.
  3. 각 계급에 속하는 변량의 개수를 세어 계급의 도수를 구한다.

2번에서 OO 이상 ~ OO 미만은 첫 번째 계급에만 적어주면 돼요.

3번에서 각 계급에 속하는 도수를 모두 더한 것이 전체 변량의 개수와 같은지 확인하세요. 빼먹은 것이 있거나 두 번 센 것이 있는지 확인하는 과정이에요.

다음 수학 점수를 이용하여 도수분포표를 만들고, 물음에 답하여라.
92     88     76     90     96
72     84     82     86     74
90     86     94     88     68
82     84     86     98     84
(1) 계급의 개수를 구하여라.
(2) 점수가 82점인 학생이 속하는 계급을 구하여라.
(3) 점수가 10번째로 높은 학생이 속하는 계급의 계급값을 구하여라.
(4) 도수가 가장 작은 계급을 구하여라.

도수분포표를 만드는 첫 단계는 변량 중에서 가장 큰 것과 가장 작은 것을 찾는 거예요. 가장 큰 변량은 마지막 줄 네 번째에 있는 98이고 가장 작은 변량은 세 번째 줄 마지막 68이네요.

계급을 나누는데, 계급의 크기를 10으로 만들어볼까요? 물론 5로 해도 상관은 없어요. 계급의 크기를 10으로 하는데, 68과 98이 들어가야 하니까 처음 계급은 60점 이상 ~ 70점 미만이 되어야겠고, 마지막 계급은 90점 이상 100점 미만으로 해야겠네요.

계급을 나누고 계급에 해당하는 점수를 적어보죠.
60 ~ 70 : 68 (한 개)
70 ~ 80 : 76, 72, 74 (세 개)
80 ~ 90 : 88, 84, 82, 86, 86, 88, 82, 84, 86, 84(열 개)
90 ~ 100 : 92, 90, 96, 90, 94, 98(여섯 개)

괄호안의 숫자를 다 더해보면 20개가 되어서 문제에서 준 변량의 개수와 똑같죠?

각 계급에 해당하는 점수의 개수, 즉 도수를 구했으니 표로 만들어볼까요?

점수(점) 학생 수(명)
60 이상 ~ 70 미만 1
70 ~ 80 3
80 ~ 90 10
90 ~ 100 6
합계 20

(1) 계급의 개수는 60 ~ 70, 70 ~ 80, 80 ~ 90, 90 ~ 100 이렇게 네 개군요.

(2) 점수가 82점인 학생이 속하는 계급은 80점 이상 90점 미만이고요.

(3) 점수가 10번째로 높은 학생이 속하는 계급은 80점 이상 90점 미만이네요. 계급값은 양 끝값을 더해서 2로 나누어준 것이니까 (80 + 90) ÷ 2 = 85점이군요.

(4) 도수가 가장 작은 계급은 도수가 1인 60점 이상 70점 미만이네요.

함께 보면 좋은 글

줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표에서의 평균구하기
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법

정리해볼까요

도수분포표 만드는 법

  1. 가장 큰 변량과 가장 작은 변량을 찾는다.
  2. 가장 큰 변량과 가장 작은 변량을 포함하는 계급을 만든다.
  3. 각 계급에 속하는 변량의 개수를 조사하여 도수를 구한다.
 
그리드형

새로운 단원은 통계입니다. 통계는 비교적 어려운 단원이에요.

새로운 용어가 많이 나오는 데다 비슷비슷해서 헛갈리기도 쉽지요. 용어의 뜻을 정확히 알아야 해요. 문제에 나오거나 설명하는 단어를 제대로 이해하지 못하면 문제를 풀 수가 없거든요.

용어를 설명하다 보니까 약간 딱딱할 수 있어요. 용어를 이해한다고 하는 게 꼭 여기에 나온 표현대로 뜻을 이해할 필요는 없어요. 자기 나름대로 표현 방식으로 단어의 뜻을 이해하세요.

들어가기 전에

열 명의 1학기 기말고사 시험 수학 점수가 있어요. 92, 84, 88, 76, 96, 72, 92, 84, 68, 96점을 받았다고 해보죠.

70점대 몇 명, 80점대 몇 명 … 이런 식으로 점수대별로 몇 명이나 있는지 표를 만들어볼게요.

1학기 기말고사 수학 시험 점수
점수(점) 학생 수(명)
60 이상 ~ 70 미만 1
70 ~ 80 2
80 ~ 90 3
90 ~ 100 4
합계 10

10명의 점수를 주면 여러분은 위 표처럼 나타낼 수 있죠?

이번 글에서 우리가 공부할 게 뭐냐면 바로 위 표에서 사용하는 용어들이에요. 용어를 모른다고 해서 표를 못 만드는 건 아니에요. 하지만 용어를 알면 표를 더 쉽고 정확하게 만들 수 있죠. 또 표에서 좀 더 정확한 정보를 읽어낼 수도 있어요.

변량, 계급, 계급값, 계급의 크기, 도수, 도수분포표

변량

변량은 점수, 시간 같은 여러 자료를 수량으로 나타낸 것을 말해요. 그냥 자료를 쭉 적어놓은 거로 생각하면 쉬워요.

위에서는 수학 점수 92, 84, 88, 76, 96, … 이렇게 쭉 쓰여 있는 게 변량이에요.

계급

계급은 변량을 일정한 간격으로 나눈 구간이에요.

70점대 몇 명, 80점대 몇 명 … 이런 식으로 점수대별로 학생 수를 알아보려면 어떻게 했죠? 70 ~ 80, 80 ~ 90, 90 ~ 100 이렇게 점수를 나눴잖아요. 이렇게 점수별로 나누어 놓은 구간이 계급이에요. 위의 표에서 왼쪽에 있는 게 계급이에요.

계급의 크기라는 용어도 있어요. 계급의 크기는 계급의 간격(너비)을 말해요.

위 예에서 70 ~ 80이라는 계급이 있었어요. 여기서 계급의 크기는 10이에요. 70과 80 사이는 10의 차이가 있잖아요.

계급의 크기 = (계급의 큰 쪽 끝값) - (계급의 작은 쪽 끝값)

중요한 건 계급의 크기는 모두 같다는 거예요. 한 계급이 70 ~ 80이었으면 그다음 계급은 80 ~ 90이 되어야 해요. 70 ~ 80, 80 ~ 85 이렇게 크기가 다르게 계급을 나누면 안돼요.

계급값은 계급을 대표하는 값으로 각 계급의 한가운데 값(중앙값)을 말해요. 70 ~ 80 사이의 한 가운데 값은 75죠. 그래서 75가 이 계급의 계급값이에요.

계급값 = (계급의 양 끝값의 합) ÷ 2

80 ~ 90의 계급값은 85, 90 ~ 100의 계급값은 95가 되겠죠?

도수

도수는 각 계급에 속하는 변량의 개수예요.

60 ~ 70점에 해당하는 점수는 68점 하나네요. 70 ~ 80점에 해당하는 점수는 72, 76점으로 두 명이에요. 80 ~ 90점에 해당하는 점수는 84, 86, 84 세 명이고, 90 ~ 100점에 해당하는 점수는 92, 96, 92, 96 네 명이에요.

같은 값이 있어도 하나로 세지 않고 각각을 따로 세요.

여기서 60 ~ 70에 해당하는 점수가 하나니까 도수는 1, 70 ~ 80에 해당하는 점수는 두 개니까 도수가 2이고, 80 ~ 90에 해당하는 점수가 세 개니까 도수는 3, 90 ~ 100에 해당하는 점수는 네 개니까 도수가 4예요. 앞 표에서 오른쪽에 있는 게 도수지요.

즉 어떤 계급에 해당하는 자료가 몇 개인가가 바로 도수예요.

도수분포표

마지막으로 도수분포표는 주어진 전체 자료를 몇 개의 계급으로 나누고 각 계급에 속하는 도수를 조사하여 나타낸 표예요. 그러니까 앞 표가 바로 도수분포표예요.

도수분포표를 보면 한 자료가 전체에서 어느 위치에 속하는지를 쉽게 알아볼 수 있어요. 84점이라는 수학 점수가 전체에서 어느 정도나 되는지를 파악하기가 쉽죠. 또 전체 자료의 분포를 파악하는 데도 도움이 돼요.

하지만 자료 하나하나의 특징을 파악하기 어려운 단점도 있어요. 80 ~ 90에 3명이 있는데, 이들의 점수가 몇 점인지는 알 수 없다는 거지요.

함께 보면 좋은 글

줄기와 잎 그림
도수분포표 만드는 법
도수분포표에서의 평균구하기
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법

정리해볼까요

도수분포표

  • 변량: 자료를 수량으로 나타낸 것
  • 계급: 변량을 일정한 간격으로 나눈 구간
  • 계급의 크기: 계급의 구간 너비. (계급의 큰 쪽 끝값) - (계급의 작은 쪽 끝값)
  • 계급값: 각 계급의 중앙값. (계급의 양 끝값의 합) ÷ 2
  • 도수: 각 계급에 해당하는 변량의 개수
  • 도수분포표: 주어진 자료를 몇 개의 계끕으로 나누고 각 계급에 속하는 도수를 조사하여 나타낸 표.
 
그리드형

+ 최근글