새로운 단원은 통계입니다. 통계는 비교적 어려운 단원이에요.

새로운 용어가 많이 나오는 데다 비슷비슷해서 헛갈리기도 쉽지요. 용어의 뜻을 정확히 알아야 해요. 문제에 나오거나 설명하는 단어를 제대로 이해하지 못하면 문제를 풀 수가 없거든요.

용어를 설명하다 보니까 약간 딱딱할 수 있어요. 용어를 이해한다고 하는 게 꼭 여기에 나온 표현대로 뜻을 이해할 필요는 없어요. 자기 나름대로 표현 방식으로 단어의 뜻을 이해하세요.

들어가기 전에

열 명의 1학기 기말고사 시험 수학 점수가 있어요. 92, 84, 88, 76, 96, 72, 92, 84, 68, 96점을 받았다고 해보죠.

70점대 몇 명, 80점대 몇 명 … 이런 식으로 점수대별로 몇 명이나 있는지 표를 만들어볼게요.

1학기 기말고사 수학 시험 점수
점수(점) 학생 수(명)
60 이상 ~ 70 미만 1
70 ~ 80 2
80 ~ 90 3
90 ~ 100 4
합계 10

10명의 점수를 주면 여러분은 위 표처럼 나타낼 수 있죠?

이번 글에서 우리가 공부할 게 뭐냐면 바로 위 표에서 사용하는 용어들이에요. 용어를 모른다고 해서 표를 못 만드는 건 아니에요. 하지만 용어를 알면 표를 더 쉽고 정확하게 만들 수 있죠. 또 표에서 좀 더 정확한 정보를 읽어낼 수도 있어요.

변량, 계급, 계급값, 계급의 크기, 도수, 도수분포표

변량

변량은 점수, 시간 같은 여러 자료를 수량으로 나타낸 것을 말해요. 그냥 자료를 쭉 적어놓은 거로 생각하면 쉬워요.

위에서는 수학 점수 92, 84, 88, 76, 96, … 이렇게 쭉 쓰여 있는 게 변량이에요.

계급

계급은 변량을 일정한 간격으로 나눈 구간이에요.

70점대 몇 명, 80점대 몇 명 … 이런 식으로 점수대별로 학생 수를 알아보려면 어떻게 했죠? 70 ~ 80, 80 ~ 90, 90 ~ 100 이렇게 점수를 나눴잖아요. 이렇게 점수별로 나누어 놓은 구간이 계급이에요. 위의 표에서 왼쪽에 있는 게 계급이에요.

계급의 크기라는 용어도 있어요. 계급의 크기는 계급의 간격(너비)을 말해요.

위 예에서 70 ~ 80이라는 계급이 있었어요. 여기서 계급의 크기는 10이에요. 70과 80 사이는 10의 차이가 있잖아요.

계급의 크기 = (계급의 큰 쪽 끝값) - (계급의 작은 쪽 끝값)

중요한 건 계급의 크기는 모두 같다는 거예요. 한 계급이 70 ~ 80이었으면 그다음 계급은 80 ~ 90이 되어야 해요. 70 ~ 80, 80 ~ 85 이렇게 크기가 다르게 계급을 나누면 안돼요.

계급값은 계급을 대표하는 값으로 각 계급의 한가운데 값(중앙값)을 말해요. 70 ~ 80 사이의 한 가운데 값은 75죠. 그래서 75가 이 계급의 계급값이에요.

계급값 = (계급의 양 끝값의 합) ÷ 2

80 ~ 90의 계급값은 85, 90 ~ 100의 계급값은 95가 되겠죠?

도수

도수는 각 계급에 속하는 변량의 개수예요.

60 ~ 70점에 해당하는 점수는 68점 하나네요. 70 ~ 80점에 해당하는 점수는 72, 76점으로 두 명이에요. 80 ~ 90점에 해당하는 점수는 84, 86, 84 세 명이고, 90 ~ 100점에 해당하는 점수는 92, 96, 92, 96 네 명이에요.

같은 값이 있어도 하나로 세지 않고 각각을 따로 세요.

여기서 60 ~ 70에 해당하는 점수가 하나니까 도수는 1, 70 ~ 80에 해당하는 점수는 두 개니까 도수가 2이고, 80 ~ 90에 해당하는 점수가 세 개니까 도수는 3, 90 ~ 100에 해당하는 점수는 네 개니까 도수가 4예요. 앞 표에서 오른쪽에 있는 게 도수지요.

즉 어떤 계급에 해당하는 자료가 몇 개인가가 바로 도수예요.

도수분포표

마지막으로 도수분포표는 주어진 전체 자료를 몇 개의 계급으로 나누고 각 계급에 속하는 도수를 조사하여 나타낸 표예요. 그러니까 앞 표가 바로 도수분포표예요.

도수분포표를 보면 한 자료가 전체에서 어느 위치에 속하는지를 쉽게 알아볼 수 있어요. 84점이라는 수학 점수가 전체에서 어느 정도나 되는지를 파악하기가 쉽죠. 또 전체 자료의 분포를 파악하는 데도 도움이 돼요.

하지만 자료 하나하나의 특징을 파악하기 어려운 단점도 있어요. 80 ~ 90에 3명이 있는데, 이들의 점수가 몇 점인지는 알 수 없다는 거지요.

함께 보면 좋은 글

줄기와 잎 그림
도수분포표 만드는 법
도수분포표에서의 평균구하기
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법

정리해볼까요

도수분포표

  • 변량: 자료를 수량으로 나타낸 것
  • 계급: 변량을 일정한 간격으로 나눈 구간
  • 계급의 크기: 계급의 구간 너비. (계급의 큰 쪽 끝값) - (계급의 작은 쪽 끝값)
  • 계급값: 각 계급의 중앙값. (계급의 양 끝값의 합) ÷ 2
  • 도수: 각 계급에 해당하는 변량의 개수
  • 도수분포표: 주어진 자료를 몇 개의 계끕으로 나누고 각 계급에 속하는 도수를 조사하여 나타낸 표.