도수분포표에 대해서 알아봤어요. 여러 개의 자료로 표를 만들면 자료의 위치나 흐름 등을 쉽게 파악할 수 있는 장점이 있어요.

이번 글에서 공부할 히스토그램은 도수분포표에서 한 발 더 나가서 표가 아니라 그림으로 그리는 거예요. 그림이 글자보다 직관적이고 이해하기가 쉽잖아요.

히스토그램이 무엇인지, 히스토그램을 어떻게 그리는지 알아보죠.

히스토그램

도수분포표는 아래 표처럼 생겼어요. 왼쪽 칸에는 계급을 쓰고 오른쪽 칸에는 도수를 적지요. 제일 아랫줄에는 도수의 총합을 적어요.

아래는 도수분포표 만드는 법에서 사용한 수학 점수를 도수분포표로 나타낸 거예요.

점수(점) 학생 수(명)
60 이상 ~ 70 미만 1
70 ~ 80 3
80 ~ 90 10
90 ~ 100 6
합계 20

이 도수분포표의 왼쪽에 있는 계급을 가로축에, 오른쪽 칸에 있는 도수를 세로축에 표시해서 직사각형 모양으로 나타낸 그래프가 바로 히스토그램이에요.

히스토그램으로 그리면 아래처럼 생겼어요.

히스토그램

히스토그램 그리는 방법

위에서 설명한 것처럼 히스토그램의 가로축에는 도수분포표에서의 계급의 양 끝값을, 세로축에는 도수를 써요. 눈금과 눈금 사이가 아닌 눈금선이 있는 부분에 계급의 양 끝값과 도수를 써야 해요.

그리고 실제 사용하는 계급 앞과 뒤에 한 칸씩을 더 만드세요.

각 계급을 가로로, 도수를 세로로 하는 직사각형을 그려요. 주의할 건 눈금에 다 채워서 그려야 해요. 옆의 직사각형과 바로 붙도록 그립니다. 아래 그림처럼 직사각형 사이가 서로 떨어져 있으면 안 돼요. 앞의 그림은 제대로 된 히스토그램, 아래 그림은 잘못된 히스토그램입니다.

잘못된 히스토그램

히스토그램의 특징

히스토그램은 그림(그래프)이므로 자료의 분포 상태를 도수분포표보다 좀 더 쉽게 알아볼 수 있어요. 글자보다 그림이 이해하기 쉬운 건 당연하잖아요.

히스토그램에서 한 계급의 직사각형의 넓이를 한 번 구해볼까요? 한 계급에서 가로의 길이는 계급의 크기와 같아요. 세로의 길이는 도수와 같죠. 그래서 직사각형의 넓이는 (계급의 크기) × (계급의 도수)가 되겠죠? 60점 이상 70점 미만의 직사각형의 넓이는 10 × 1 = 10, 70점 이상 80점 미만의 직사각형의 넓이는 10 × 3 = 30 이렇게 구할 수 있죠.

그런데 가로에 있는 계급의 크기는 계급이 달라도 모두 일정해요. 따라서 직사각형의 넓이는 도수에 비례해요.

다음이 중요한 내용인데요. 전체 직사각형의 넓이를 구해볼까요? 각각의 직사각형의 넓이를 다 더하면 되겠죠? 60점 이상 70점 미만은 10, 70점 이상 80점 미만은 30, 80점 이상 90점 미만은 10 × 10 = 100, 90점 이상 100점 미만은 10 × 6 = 60이죠. 10 + 30 + 100 + 60 = 200이네요.

이번에는 (계급의 크기) × (총 도수)를 구해볼까요? 10 × (1 + 3 + 10 + 6) = 10 × 20 = 200이에요. 위에서 구한 직사각형의 넓이와 같죠?

직사각형의 전체 넓이 = {(계급의 크기) × (도수)}의 총합 = (계급의 크기) × (총 도수)

아래 히스토그램을 보고 아래 물음에 답하여라.
(1) 계급값이 85점인 계급의 도수를 구하여라.
(2) 계급값이 95점인 계급의 직사각형의 넓이는 60점 이상 70점 미만인 계급의 직사각형의 넓이의 몇 배인가?
히스토그램

(1)에서 계급값이 85이므로 계급은 80점 이상 90점 미만이 되겠죠? 이 계급에서 막대의 세로가 도수니까 10이네요.

(2)는 계급값이 95점인 계급은 90점 이상 100점 미만인데, 이때의 도수는 6이에요. 60점 이상 70점 미만인 계급의 도수는 1이고요. 넓이는 도수에 비례한다고 했으니까 두 계급의 직사각형의 넓이를 비교할 때는 실제 넓이가 아닌 도수만 비교해도 돼요. 6/1 = 6이라서 넓이는 6배 입니다.

히스토그램과 막대그래프의 차이

히스토그램은 얼핏 보면 막대그래프와 닮았어요. 그런데 왜 막대그래프가 아닌 히스토그램을 그릴까요?

막대그래프는 보통 연속되지 않는 자료들을 그래프로 그릴 때 사용해요. 사과는 몇 개, 수박은 몇 개, 이럴 때 사용하죠. 수박과 사과는 서로 연결할 수 없잖아요.

히스토그램은 60 ~ 70점, 70 ~ 80점, … 처럼 서로 연속된 자료를 나타낼 때 사용합니다. 첫 번째 계급의 끝값인 70점과 두 번째 계급의 70점이 서로 연결되잖아요.

그래프를 보면 가장 눈에 띄는 게 있어요. 히스토그램은 막대가 서로 붙어 있고, 막대그래프는 벌어져 있어요. 위에서 설명한 연속이냐 연속하지 않느냐의 차이 때문에 생기는 건데요. 60 ~ 70, 70 ~ 80은 연속하니까 죽 붙여서 그려야 하는 거지요.

함께 보면 좋은 글

줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표 만드는 법
도수분포표에서의 평균구하기
도수분포다각형, 도수분포다각형 그리는 방법

정리해볼까요

히스토그램이란?

  • 도수분포표의 계급을 가로축에, 도수를 세로축에 표시하여 직사각형 모양으로 나타낸 그래프
  • 도수분포표보다 자료의 분포 상태를 한 눈에 알아볼 수 있다.
  • 직사각형의 전체 넓이 = {(계급의 크기) × (도수)}의 총합 = (계급의 크기) × (총 도수)
 
그리드형