도수

이번에는 도수분포표를 보고 분산과 표준편차를 구하는 방법이에요. 분산과 표준편차에서 얘기한 것처럼 표준편차를 구하려면, 평균 → 편차 → 분산 → 표준편차의 순서대로 구해야 해요.

그런데 도수분포표에서 평균 구하는 방법은 일반적인 평균구하는 방법과 달랐죠? 도수분포표에서의 평균 구하기에서 했던 방법으로 평균을 먼저 구해야 해요. 미리 확인하세요.

이 글에서는 1학년 때 배웠던 도수분포표 관련 내용과 앞에서 배운 산포도의 내용이 모두 총망라돼서 나와요. 산포도 구하는 방법과 공식을 꼭 기억하고 있어야 해요.

도수분포표에서 분산과 표준편차 구하기

도수분포표에서 분산과 표준편차를 구할 때 가장 중요한 것은 도수예요. 일반적인 변량들로 된 자료에서는 각각의 값들을 정확하게 알 수 있어요. 하지만 도수분포표는 정확한 값을 알 수 없기 때문에 계급값을 이용하죠. 그리고 계급값을 이용하여 얻은 값들은 도수가 포함되지 않은 값들이에요. 따라서 값에 도수를 곱해줘야 우리가 원하는 걸 얻을 수 있어요.

뭔 말인지 모르겠죠? 실제로 구해보면서 정리해보죠. 아래같은 도수분포표가 있다고 해볼까요?

도수분포표
점수(점) 학생 수(명)
60 이상 ~ 70 미만 1
70 ~ 80 3
80 ~ 90 11
90 ~ 100 5
합계 20

평균 → 편차 → 분산 → 표준편차를 구해야 해요.

분산과 표준편차를 구할 때는 아래처럼 표를 이용해서 구하는 게 알아보기 쉽고 편해요.

도수분포표에서 분산과 표준편차 구하기
점수 (점) 학생 수 (명) 계급값 계급값 × 도수 편차 (편차)2 × 도수
60이상 ~ 70미만 1 65 65 × 1 = 65 65 - 85 = -20 (-20)2 × 1 = 400
70 ~ 80 3 75 75 × 3 = 225 75 - 85 = -10 (-10)2 × 3 = 300
80 ~ 90 11 85 85 × 11 = 935 85 - 85 = 0 (0)2 × 11 = 0
90 ~ 100 5 95 95 × 5 = 475 95 - 85 = 10 (10)2 × 5 = 500
합계 20 65 + 225 + 935 + 475 = 1700 400 + 300 + 0 + 500 = 1200
평균 1700 ÷ 20 = 85 1200 ÷ 20 = 60
  1. 계급값은 각 구간의 양 끝값을 더해서 2로 나눈 값이죠? 도수분포표, 변량, 계급, 계급값, 도수에서 계급값 구하는 방법도 해봤어요. 계급값을 이용해서 평균을 구했더니 85가 나왔네요.
  2. 평균을 구한 다음에는 편차를 구해야 해요. 편차 구하는 공식의 변량 자리에 계급값을 넣어주세요.
  3. 편차를 구한 다음에는 분산을 구해야 하는데요. 분산은 편차의 제곱의 평균이라고 했어요. 그런데 도수분포표에서는 편차 제곱에 도수를 구한 것들의 평균이에요. 편차의 제곱에 도수를 꼭 곱해줘야 해요.

    일반적인 변량이었다면 각각 편차를 구해서 더했을 텐데, 도수분포표에서는 각각의 편차를 구할 수 없기때문에 대표인 계급값을 이용했던 거거든요. 그런데 같은 계급값을 갖는 변량이 도수의 개수만큼 있잖아요. 특정한 계급값을 대표로 갖는 도수의 개수만큼을 곱해줘야 해당 계급의 변량들의 값을 모두 더한 게 되는 거죠.

    편차의 합은 0이라고 했는데, 위 도수분포표에서 편차의 합은 0이 아니에요. 대신 편차에 도수를 곱해서 더하면 0이 되는 겁니다.
    각 계급의 (편차)2 × 도수를 구한 다음에 도수의 총합으로 나누면 그게 바로 분산입니다. 분산이 60이 나왔네요.
  4. 마지막으로 표준편차는 분산에 제곱근을 씌운 거니까 가 되네요.

함께 보면 좋은 글

대푯값과 평균, 중앙값, 최빈값
산포도와 편차
분산과 표준편차
[중등수학/중1 수학] - 도수분포표, 변량, 계급, 계급값, 도수
[중등수학/중1 수학] - 도수분포표 만드는 법
[중등수학/중1 수학] - 도수분포표에서의 평균구하기

정리해볼까요

도수분포표에서의 표준편차 구하기

  • 표준편차 구하는 순서: 평균 → 편차 → 분산 → 표준편차
  • 평균 = {(계급값) × (도수)}의 총합 ÷ (도수의 총합)
  • 편차 = 계급값 - 평균
  • 분산 = {(편차)2 × 도수}의 총합 ÷ (도수의 총합)
  • 표준편차 = 분산의 음이 아닌 제곱근
 
그리드형

이번 글은 누적도수의 그래프를 그리는 방법에 대한 글로 통계 마지막 시간이에요.

통계는 크게 보면 두 가지에요. 용어 배우고, 표와 그래프를 그리는 거지요.

각 용어에 도수, 상대도수, 누적도수가 있어요. 각 용어에 맞게 표나 그래프 그리는 법을 익혀두세요.

누적도수의 그래프를 그리는 방법은 도수분포다각형이나 상대도수의 그래프 그리는 법과 딱 한 가지가 달라요. 바꿔 말하면 그 다른 한가지가 매우 중요하다는 거지요.

누적도수의 그래프 그리는 방법

  1. 세로축에 누적도수를 가로축에 각 계급의 양 끝값을 적는다.
  2. 각 계급의 끝값 중에 큰 쪽 끝값과 누적도수가 만나는 곳에 점을 찍는다. 이때 첫 번째 계급의 왼쪽 끝에 도수가 0인 점을 찍는다.
  3. 각 점을 차례대로 선으로 연결한다.

2번이 다른 그래프와 다른 점이고 가장 중요한 부분이에요.

다른 그래프에서는 양 계급 끝값의 가운데, 즉 계급값 부분에 점을 찍었는데, 누적도수의 그래프에서는 계급값이 아니라 끝값 중 큰 값에 점을 찍어요.

누적도수의 그래프

그 계급의 누적도수 = 계급의 도수 + 앞 계급의 누적도수
계급의 도수 = 해당 계급의 누적도수 - 앞 계급의 누적도수

그래프를 보고 이웃한 두 계급의 누적도수를 알면 계급의 도수를 구할 수 있겠지요?

누적도수 그래프의 특징

오른쪽 위로 올라가는 모양이에요. 누적이라는 뜻 자체가 숫자가 커진다는 걸 의미하니까 오른쪽으로 갈수록 숫자가 커지고 그 때문에 오른쪽으로 갈수록 위로 올라가는 그래프가 돼요.

경사가 가장 급한 곳의 도수가 가장 커요. 경사가 크다는 말은 앞의 누적도수와 차이가 크다는 말이지요. 함수에서 기울기를 생각해보세요. x의 증가량에 해당하는 계급의 크기는 똑같아요. 여기에 y의 증가량에 해당하는 해당 계급의 도수 (그 계급의 누적도수 - 앞 계급의 누적도수)가 클수록 경사가 커지겠죠?

경사가 없는 계급은 도수가 0인 걸 말해요. 경사가 없이 평평하다는 건 "그 계급의 누적도수- 앞 계급의 누적도수 = 0" 라는 말이잖아요.

그래프에서 마지막 계급의 오른쪽 끝점의 누적도수는 도수의 총합과 같아요. 누적도수의 분포표에서 계급의 누적도수는 도수의 총합과 같았죠? 그래프에서도 마찬가지예요.

아래는 수학 점수를 구간별로 나눈 누적도수의 그래프이다. 그래프를 보고 물음에 답하여라.
(1) 도수가 가장 큰 계급의 계급값을 구하여라.
(2) 점수가 10번째로 높은 학생이 속한 계급을 구하여라.
누적도수의 그래프

(1)번 실제 도수를 구하지 않더라도 그래프에서 경사가 가장 큰 곳이 도수가 가장 큰 계급이라고 했어요. 위 그래프에서 경사가 가장 큰 곳은 80점 이상 90점 미만인 계급이네요. 문제에서 구하라고 한 것은 계급이 아니라 계급값이니까 (90 + 80) ÷ 2 = 85가 되겠네요.

(2)번 점수가 10번째로 높은 학생이니까 오른쪽에서 10번에 해당하는 학생, 즉 11에 해당하는 도수가 속한 구간을 찾아야겠지요. 11이라는 도수와 만나는 계급은 80점 이상 90점 미만이네요.

함께 보면 좋은 글

도수분포다각형, 도수분포다각형 그리는 방법
상대도수와 상대도수의 분포표
상대도수의 그래프
누적도수와 누적도수의 분포표

정리해볼까요

누적도수의 그래프

  • 누적도수의 그래프 그리기
    1. 가로축에 계급의 양 끝값, 세로축에 누적도수를 적는다.
    2. 계급의 끝 값중 큰 값과 누적도수가 만나는 곳에 점을 찍는다. 가장 처음 계급의 왼쪽 끝 값에 도수가 0인 점을 찍는다.
    3. 점들을 선분으로 연결한다.
  • 누적도수 그래프의 특징
    • 오른쪽 위로 올라가는 모양
    • 경사가 가장 큰 곳이 도수가 가장 크다.
    • 경사가 없이 평평한 곳은 도수가 0
<<    중1 수학 목차    >>
 
그리드형

도수, 상대도수라는 용어를 공부했어요.

이번 글에서 배울 용어는 누적도수라는 용어에요. 도수, 상대도수에서 사용하는 도수와 같은 도수인데, 앞에 누적이라는 말이 붙어있죠? 국어사전에서 누적이라는 말은 "포개어 여러 번 쌓음"이라고 되어있네요.

즉, 누적도수는 도수를 계속 쌓아가는 걸 말해요. 도수분포표에서 처음 계급부터 어떤 계급까지의 도수를 차례대로 더한 값이에요. 쉽게 말해서 계급의 도수에 앞에 있는 계급의 도수까지 모두 더한다고 생각하면 돼요.

누적도수의 분포표

어떤 계급의 누적도수 = 그 계급의 도수 + 처음 계급부터 앞 계급까지의 도수의 합
                                   = 그 계급의 도수 + 앞 계급의 누적도수

아래 표에서 왼쪽은 시험 점수를 10점 단위로 나눈 계급이고, 가운데는 점수별 학생 수에요. 오른쪽에는 누적도수를 나타낸 겁니다. 이 표처럼 각 계급의 누적도수를 표로 나타낸 것을 누적도수의 분포표라고 해요.

점수(점) 학생 수(명) 누적 도수(명)
60 이상 ~ 70 미만 1 1
70 ~ 80 3 1 + 3 = 4
80 ~ 90 10 1 + 3 + 10 = 14
4 + 10 = 14
90 ~ 100 6 1 + 3 + 10 + 6 = 20
14 + 6 = 20
합계 20

제일 처음 계급인 60점 이상 70점 미만인 학생 수는 1명이에요. 이보다 앞에는 계급이 없으니까 누적도수는 1이지요.

두 번째 70점 이상 80점 미만인 학생 수는 3명이에요. 이보다 앞에는 60점 이상 70점 미만이라는 계급이 있고 도수가 1이에요. 그래서 1 + 3 = 4라는 누적도수를 갖게 돼요.

세 번째 80점 이상 90점 미만인 학생 수는 10명이에요. 이보다 앞에는 60점 이상 70점 미만, 70점 이상 80점 미만이라는 두 개의 계급이 있고, 이 계급에는 각각 1, 3이라는 도수가 있어요. 1 + 3 + 10 = 14라는 누적도수를 갖게 돼요. 사실 70점 이상 80점 미만의 누적도수가 4였기 때문에 그냥 4 + 10 = 14로 계산해도 돼요.

네 번째 90점 이상 100점 미만인 학생 수는 6명이죠. 이보다 앞에는 60점 이상 70점 미만, 70점 이상 80점 미만, 80점 이상 90점 미만이라는 세 개의 계급이 있고, 이 세 계급의 누적도수는 14지요. 그래서 누적도수는 14 + 6 = 20이에요.

누적도수의 특징

누적도수에는 두 가지 큰 특징이 있어요. 첫 번째 그림인 누적도수의 분포표에서 빨간색으로 표시된 곳이요.

  • 첫 번째 계급은 누적도수 = 도수
  • 마지막 계급의 누적도수 = 도수의 총합

첫 번째 계급은 앞 계급이 없으니까 더할 게 0이어서 누적도수와 계급의 도수가 같아요.

마지막 계급의 누적도수는 그 이후로 더할 게 없죠. 더할 수 있는 건 다 더했다는 거예요. 그래서 총 도수와 마지막 계급의 누적도수가 같아요. 마지막 계급의 누적도수와 총 도수가 같으니까 누적도수의 합계란에는 빈 칸으로 두는 거예요.

누적도수는 어떤 대상이 자료 전체에서 차지하는 위치를 알고 싶을 때 사용해요. 예를 들어 90점인 학생은 전체에서 몇 등인가를 구할 때 그냥 도수분포표보다 훨씬 편리하지요.

아래 누적도수의 분포표를 보고, A, B, C, D의 값을 구하여라.

점수(점) 학생 수(명) 누적 도수(명)
60 이상 ~ 70 미만 2 A
70 ~ 80 3 B
80 ~ 90 C 16
90 ~ 100 4 20
합계 D

A는 첫 번째 계급의 누적도수이므로 계급의 도수와 같아요. A = 2네요.
B는 계급의 도수인 3과 앞 계급의 누적도수 A = 2를 더해서 5가 되고요.
C는 그냥 도수죠. 앞 계급의 누적도수인 5와 C를 더해서 16이어야 하므로 C = 11이어야 하고요.
D는 총 도수인데, 총 도수는 마지막 계급의 누적도수와 같죠? 마지막 계급의 누적도수가 20이므로 총 도수도 20입니다.

함께 보면 좋은 글

도수분포표, 변량, 계급, 계급값, 도수
도수분포다각형, 도수분포다각형 그리는 방법
상대도수와 상대도수의 분포표
상대도수의 그래프
누적도수의 그래프, 누적도수 그래프 그리는 방법

정리해볼까요

누적도수

  • 도수분포표에서 첫 번째 계급부터 어떤 계급까지의 도수를 차례대로 더하여 얻은 값
  • 계급의 누적도수 = 그 계급의 도수 + 앞 계급의 누적도수
  • 첫 번째 계급에서는 누적도수 = 도수
  • 마지막 계급의 누적도수 = 도수의 총합
<<    중1 수학 목차    >>
 
그리드형

통계 단원에 점점 익숙해지고 있나요?

새로운 용어도 많이 나오고 표도 만들고 그래프도 그려야 해서 조금 어렵죠? 이 글에서도 새로운 용어와 표 만들기를 할 거예요. 하지만 어렵게 생각하지 마세요. 이미 공부했던 도수와 도수분포표에 숟가락 하나만 얹으면 되거든요.

상대도수

상대도수는 도수의 총합에 대한 각 계급의 도수의 비율을 말해요. 그러니까 전체에 대한 상대적인 크기죠. 상대도수를 식으로 쓰면 아래와 같아요.

계급의 상대도수 = (계급의 도수) ÷ (도수의 총합)

백분율 구할 때 어떻게 하나요? 전체 40개 중 20개의 백분율을 구할 때, 20 ÷ 40 × 100 = 50% 이렇게 구하죠? 상대도수를 구할 때는 뒤에 × 100만 빼주면 돼요. 전체 도수가 40이고, 어떤 계급의 도수가 20이면 이 계급의 상대도수는 20 ÷ 40 = 0.5인 거죠.

아래 표에서 총 도수는 20이고, 80점 이상 90점 미만의 도수가 10이죠. 그럼 80점 이상 90점 미만의 상대도수는 10 ÷ 20 = 0.5예요.

이런 식으로 각 계급의 상대도수를 모두 구하면 아래 표처럼 돼요.

점수(점) 학생 수(명) 상대도수
60 이상 ~ 70 미만 1 1 ÷ 20 = 0.05
70 ~ 80 3 3 ÷ 20 = 0.15
80 ~ 90 10 10 ÷ 20 = 0.5
90 ~ 100 6 6 ÷ 20 = 0.3
합계 20 1

도수를 표로 나타낸 것을 도수분포표라고 하지요? 그럼 상대도수를 위 표처럼 나타낸 표를 뭐라고 할까요? 바로 상대도수의 분포표라고 합니다. 도수분포표에서 도수만 상대도수로 바뀐 것뿐이에요.

상대도수의 특징

상대도수의 분포표에서 상대도수의 총합은 1이에요.

상대도수의 분포표의 제일 마지막 칸을 볼까요? 상대도수의 총합이 얼마로 나오나요? 상대도수를 다 더해보죠. 0.05 + 0.15 + 0.5 + 0.3 = 1이죠. 위 표에서만 그런 것이 아니라 모든 상대도수의 분포표에서 항상 1이에요.

상대도수는 각 계급의 도수에 비례해요.

상대도수 구하는 식을 보죠. 도수의 총합은 일정하고 바뀌는 건 도수밖에 없어요. 그러니까 도수에 비례하는 거예요.

그냥 도수도 있는데, 왜 굳이 상대도수라는 걸 구할까요? 상대도수가 유용할 때가 있기 때문이겠죠? 언제 유용하냐?

바로 도수가 너무 커서 전체를 조사하기 힘들 때예요. 예를 들어서 전체 도수의 총합이 100만이고, 어떤 계급의 도수가 30,000, 40,000 이러면 숫자가 크니까 알아보기가 쉽지 않잖아요. 이럴 때 상대도수를 이용해서 숫자를 작게 하는 거죠.

또 도수의 총합이 다른 두 개의 자료를 비교할 때도 사용해요. 1반과 2반의 수학 점수를 비교하는데, 1반은 학생이 20명이고 2반은 25명이라면 단순히 80점 이상 90점 미만 학생 수를 비교할 수는 없겠죠? 이럴 때 상대도수를 이용해서 비교해요.

다음은 두 학급의 수학 성적을 나타낸 상대도수의 분포표이다. 물음에 답하여라.
(1) A, B, C, D의 값을 구하여라.
(2) 두 반 중 90점 이상인 학생의 비율이 더 높은 학급은 어디인지 구하여라.

점수(점) 1반 2반
학생 수(명) 상대도수 학생 수(명) 상대도수
60 이상 ~ 70 미만 1 0.05 3 A
70 ~ 80 3 0.15 B 0.12
80 ~ 90 10 0.5 14 0.56
90 ~ 100 6 0.3 C D
합계 20 1 25 E

(1)번에서 A는 총 도수가 25이고, 도수가 3이니까 3 ÷ 25 = 0.12네요.

B는 두 가지 방법으로 구할 수 있어요. B ÷ 25 = 0.12에서 B = 0.12 × 25 = 3이라는 걸 알 수 있어요. 다른 방법으로 상대도수는 도수에 비례하니까 70점 이상 80점 미만의 도수, 상대도수와 비교할 수도 있고요. B : 0.12 = 14 : 0.56이라는 비례식을 만들 수 있죠.

C를 구해보죠. C는 도수도 비어있고, 상대도수도 비어있어서 다른 방법이 필요해요. 총 도수가 25니까 3 + B + 14 + C = 25가 되어야 해요. B는 위에서 3이었으니까 C = 5겠네요.

D는 5 ÷ 25 = 0.2가 되겠죠.

E는 상대도수의 총합인데, 상대도수의 총합은 무조건 1이에요. 따라서 E = 1입니다.

(2)번에서 90점 이상인 학생의 비율이 1반은 0.3이고 2반은 0.2니까 1반의 비율이 더 높군요.

함께 보면 좋은 글

도수분포표, 변량, 계급, 계급값, 도수
도수분포표 만드는 법
히스토그램과 히스토그램의 특징, 히스토그램 그리기
상대도수와 상대도수의 분포표
상대도수의 그래프

정리해볼까요

상대도수

  • 전체 도수에 대한 계급의 도수의 비율
  • 계급의 상대도수 = (계급의 도수) ÷ (총 도수)
  • 상대도수의 특징
    • 상대도수의 총 합은 항상 1
    • 상대도수는 계급의 도수에 정비례
    • 도수의 총합이 매우 크거나 도수의 총합이 서로 다른 두 자료를 비교할 때 사용
 
그리드형

도수분포표에 대해서 알아봤어요. 여러 개의 자료로 표를 만들면 자료의 위치나 흐름 등을 쉽게 파악할 수 있는 장점이 있어요.

이번 글에서 공부할 히스토그램은 도수분포표에서 한 발 더 나가서 표가 아니라 그림으로 그리는 거예요. 그림이 글자보다 직관적이고 이해하기가 쉽잖아요.

히스토그램이 무엇인지, 히스토그램을 어떻게 그리는지 알아보죠.

히스토그램

도수분포표는 아래 표처럼 생겼어요. 왼쪽 칸에는 계급을 쓰고 오른쪽 칸에는 도수를 적지요. 제일 아랫줄에는 도수의 총합을 적어요.

아래는 도수분포표 만드는 법에서 사용한 수학 점수를 도수분포표로 나타낸 거예요.

점수(점) 학생 수(명)
60 이상 ~ 70 미만 1
70 ~ 80 3
80 ~ 90 10
90 ~ 100 6
합계 20

이 도수분포표의 왼쪽에 있는 계급을 가로축에, 오른쪽 칸에 있는 도수를 세로축에 표시해서 직사각형 모양으로 나타낸 그래프가 바로 히스토그램이에요.

히스토그램으로 그리면 아래처럼 생겼어요.

히스토그램

히스토그램 그리는 방법

위에서 설명한 것처럼 히스토그램의 가로축에는 도수분포표에서의 계급의 양 끝값을, 세로축에는 도수를 써요. 눈금과 눈금 사이가 아닌 눈금선이 있는 부분에 계급의 양 끝값과 도수를 써야 해요.

그리고 실제 사용하는 계급 앞과 뒤에 한 칸씩을 더 만드세요.

각 계급을 가로로, 도수를 세로로 하는 직사각형을 그려요. 주의할 건 눈금에 다 채워서 그려야 해요. 옆의 직사각형과 바로 붙도록 그립니다. 아래 그림처럼 직사각형 사이가 서로 떨어져 있으면 안 돼요. 앞의 그림은 제대로 된 히스토그램, 아래 그림은 잘못된 히스토그램입니다.

잘못된 히스토그램

히스토그램의 특징

히스토그램은 그림(그래프)이므로 자료의 분포 상태를 도수분포표보다 좀 더 쉽게 알아볼 수 있어요. 글자보다 그림이 이해하기 쉬운 건 당연하잖아요.

히스토그램에서 한 계급의 직사각형의 넓이를 한 번 구해볼까요? 한 계급에서 가로의 길이는 계급의 크기와 같아요. 세로의 길이는 도수와 같죠. 그래서 직사각형의 넓이는 (계급의 크기) × (계급의 도수)가 되겠죠? 60점 이상 70점 미만의 직사각형의 넓이는 10 × 1 = 10, 70점 이상 80점 미만의 직사각형의 넓이는 10 × 3 = 30 이렇게 구할 수 있죠.

그런데 가로에 있는 계급의 크기는 계급이 달라도 모두 일정해요. 따라서 직사각형의 넓이는 도수에 비례해요.

다음이 중요한 내용인데요. 전체 직사각형의 넓이를 구해볼까요? 각각의 직사각형의 넓이를 다 더하면 되겠죠? 60점 이상 70점 미만은 10, 70점 이상 80점 미만은 30, 80점 이상 90점 미만은 10 × 10 = 100, 90점 이상 100점 미만은 10 × 6 = 60이죠. 10 + 30 + 100 + 60 = 200이네요.

이번에는 (계급의 크기) × (총 도수)를 구해볼까요? 10 × (1 + 3 + 10 + 6) = 10 × 20 = 200이에요. 위에서 구한 직사각형의 넓이와 같죠?

직사각형의 전체 넓이 = {(계급의 크기) × (도수)}의 총합 = (계급의 크기) × (총 도수)

아래 히스토그램을 보고 아래 물음에 답하여라.
(1) 계급값이 85점인 계급의 도수를 구하여라.
(2) 계급값이 95점인 계급의 직사각형의 넓이는 60점 이상 70점 미만인 계급의 직사각형의 넓이의 몇 배인가?
히스토그램

(1)에서 계급값이 85이므로 계급은 80점 이상 90점 미만이 되겠죠? 이 계급에서 막대의 세로가 도수니까 10이네요.

(2)는 계급값이 95점인 계급은 90점 이상 100점 미만인데, 이때의 도수는 6이에요. 60점 이상 70점 미만인 계급의 도수는 1이고요. 넓이는 도수에 비례한다고 했으니까 두 계급의 직사각형의 넓이를 비교할 때는 실제 넓이가 아닌 도수만 비교해도 돼요. 6/1 = 6이라서 넓이는 6배 입니다.

히스토그램과 막대그래프의 차이

히스토그램은 얼핏 보면 막대그래프와 닮았어요. 그런데 왜 막대그래프가 아닌 히스토그램을 그릴까요?

막대그래프는 보통 연속되지 않는 자료들을 그래프로 그릴 때 사용해요. 사과는 몇 개, 수박은 몇 개, 이럴 때 사용하죠. 수박과 사과는 서로 연결할 수 없잖아요.

히스토그램은 60 ~ 70점, 70 ~ 80점, … 처럼 서로 연속된 자료를 나타낼 때 사용합니다. 첫 번째 계급의 끝값인 70점과 두 번째 계급의 70점이 서로 연결되잖아요.

그래프를 보면 가장 눈에 띄는 게 있어요. 히스토그램은 막대가 서로 붙어 있고, 막대그래프는 벌어져 있어요. 위에서 설명한 연속이냐 연속하지 않느냐의 차이 때문에 생기는 건데요. 60 ~ 70, 70 ~ 80은 연속하니까 죽 붙여서 그려야 하는 거지요.

함께 보면 좋은 글

줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표 만드는 법
도수분포표에서의 평균구하기
도수분포다각형, 도수분포다각형 그리는 방법

정리해볼까요

히스토그램이란?

  • 도수분포표의 계급을 가로축에, 도수를 세로축에 표시하여 직사각형 모양으로 나타낸 그래프
  • 도수분포표보다 자료의 분포 상태를 한 눈에 알아볼 수 있다.
  • 직사각형의 전체 넓이 = {(계급의 크기) × (도수)}의 총합 = (계급의 크기) × (총 도수)
 
그리드형

도수분포표 만드는 법

2012. 7. 10. 12:30

도수분포표를 만드는 법을 공부해볼 거예요. 사실 도수분포표를 만드는 방법은 따로 공부하지 않아도 할 수는 있어요. 하지만 만드는 법을 공부하면 좀 더 체계적이고 더 많은 정보를 더 정확하게 줄 수 있는 도수분포표를 만들 수 있어요.

도수분포표를 만들기에 앞서 도수분포표에서 사용하는 용어들에 대해서 정확히 이해를 해야 해요. 혹시 이해되지 않는다면 도수분포표, 변량, 계급, 계급값, 도수를 한 번 읽어보세요.

도수분포표를 만드는 순서

  1. 주어진 자료에서 가장 큰 변량과 가장 작은 변량을 찾는다.
  2. 가장 큰 변량과 가장 작은 변량이 포함될 수 있는 계급을 만든다.
    계급은 OO 이상 ~ OO 미만이 되도록 하고, 계급의 크기가 모두 같아야 합니다.
    계급의 개수는 5 ~ 15개 정도가 적당해요.
  3. 각 계급에 속하는 변량의 개수를 세어 계급의 도수를 구한다.

2번에서 OO 이상 ~ OO 미만은 첫 번째 계급에만 적어주면 돼요.

3번에서 각 계급에 속하는 도수를 모두 더한 것이 전체 변량의 개수와 같은지 확인하세요. 빼먹은 것이 있거나 두 번 센 것이 있는지 확인하는 과정이에요.

다음 수학 점수를 이용하여 도수분포표를 만들고, 물음에 답하여라.
92     88     76     90     96
72     84     82     86     74
90     86     94     88     68
82     84     86     98     84
(1) 계급의 개수를 구하여라.
(2) 점수가 82점인 학생이 속하는 계급을 구하여라.
(3) 점수가 10번째로 높은 학생이 속하는 계급의 계급값을 구하여라.
(4) 도수가 가장 작은 계급을 구하여라.

도수분포표를 만드는 첫 단계는 변량 중에서 가장 큰 것과 가장 작은 것을 찾는 거예요. 가장 큰 변량은 마지막 줄 네 번째에 있는 98이고 가장 작은 변량은 세 번째 줄 마지막 68이네요.

계급을 나누는데, 계급의 크기를 10으로 만들어볼까요? 물론 5로 해도 상관은 없어요. 계급의 크기를 10으로 하는데, 68과 98이 들어가야 하니까 처음 계급은 60점 이상 ~ 70점 미만이 되어야겠고, 마지막 계급은 90점 이상 100점 미만으로 해야겠네요.

계급을 나누고 계급에 해당하는 점수를 적어보죠.
60 ~ 70 : 68 (한 개)
70 ~ 80 : 76, 72, 74 (세 개)
80 ~ 90 : 88, 84, 82, 86, 86, 88, 82, 84, 86, 84(열 개)
90 ~ 100 : 92, 90, 96, 90, 94, 98(여섯 개)

괄호안의 숫자를 다 더해보면 20개가 되어서 문제에서 준 변량의 개수와 똑같죠?

각 계급에 해당하는 점수의 개수, 즉 도수를 구했으니 표로 만들어볼까요?

점수(점) 학생 수(명)
60 이상 ~ 70 미만 1
70 ~ 80 3
80 ~ 90 10
90 ~ 100 6
합계 20

(1) 계급의 개수는 60 ~ 70, 70 ~ 80, 80 ~ 90, 90 ~ 100 이렇게 네 개군요.

(2) 점수가 82점인 학생이 속하는 계급은 80점 이상 90점 미만이고요.

(3) 점수가 10번째로 높은 학생이 속하는 계급은 80점 이상 90점 미만이네요. 계급값은 양 끝값을 더해서 2로 나누어준 것이니까 (80 + 90) ÷ 2 = 85점이군요.

(4) 도수가 가장 작은 계급은 도수가 1인 60점 이상 70점 미만이네요.

함께 보면 좋은 글

줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표에서의 평균구하기
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법

정리해볼까요

도수분포표 만드는 법

  1. 가장 큰 변량과 가장 작은 변량을 찾는다.
  2. 가장 큰 변량과 가장 작은 변량을 포함하는 계급을 만든다.
  3. 각 계급에 속하는 변량의 개수를 조사하여 도수를 구한다.
 
그리드형

새로운 단원은 통계입니다. 통계는 비교적 어려운 단원이에요.

새로운 용어가 많이 나오는 데다 비슷비슷해서 헛갈리기도 쉽지요. 용어의 뜻을 정확히 알아야 해요. 문제에 나오거나 설명하는 단어를 제대로 이해하지 못하면 문제를 풀 수가 없거든요.

용어를 설명하다 보니까 약간 딱딱할 수 있어요. 용어를 이해한다고 하는 게 꼭 여기에 나온 표현대로 뜻을 이해할 필요는 없어요. 자기 나름대로 표현 방식으로 단어의 뜻을 이해하세요.

들어가기 전에

열 명의 1학기 기말고사 시험 수학 점수가 있어요. 92, 84, 88, 76, 96, 72, 92, 84, 68, 96점을 받았다고 해보죠.

70점대 몇 명, 80점대 몇 명 … 이런 식으로 점수대별로 몇 명이나 있는지 표를 만들어볼게요.

1학기 기말고사 수학 시험 점수
점수(점) 학생 수(명)
60 이상 ~ 70 미만 1
70 ~ 80 2
80 ~ 90 3
90 ~ 100 4
합계 10

10명의 점수를 주면 여러분은 위 표처럼 나타낼 수 있죠?

이번 글에서 우리가 공부할 게 뭐냐면 바로 위 표에서 사용하는 용어들이에요. 용어를 모른다고 해서 표를 못 만드는 건 아니에요. 하지만 용어를 알면 표를 더 쉽고 정확하게 만들 수 있죠. 또 표에서 좀 더 정확한 정보를 읽어낼 수도 있어요.

변량, 계급, 계급값, 계급의 크기, 도수, 도수분포표

변량

변량은 점수, 시간 같은 여러 자료를 수량으로 나타낸 것을 말해요. 그냥 자료를 쭉 적어놓은 거로 생각하면 쉬워요.

위에서는 수학 점수 92, 84, 88, 76, 96, … 이렇게 쭉 쓰여 있는 게 변량이에요.

계급

계급은 변량을 일정한 간격으로 나눈 구간이에요.

70점대 몇 명, 80점대 몇 명 … 이런 식으로 점수대별로 학생 수를 알아보려면 어떻게 했죠? 70 ~ 80, 80 ~ 90, 90 ~ 100 이렇게 점수를 나눴잖아요. 이렇게 점수별로 나누어 놓은 구간이 계급이에요. 위의 표에서 왼쪽에 있는 게 계급이에요.

계급의 크기라는 용어도 있어요. 계급의 크기는 계급의 간격(너비)을 말해요.

위 예에서 70 ~ 80이라는 계급이 있었어요. 여기서 계급의 크기는 10이에요. 70과 80 사이는 10의 차이가 있잖아요.

계급의 크기 = (계급의 큰 쪽 끝값) - (계급의 작은 쪽 끝값)

중요한 건 계급의 크기는 모두 같다는 거예요. 한 계급이 70 ~ 80이었으면 그다음 계급은 80 ~ 90이 되어야 해요. 70 ~ 80, 80 ~ 85 이렇게 크기가 다르게 계급을 나누면 안돼요.

계급값은 계급을 대표하는 값으로 각 계급의 한가운데 값(중앙값)을 말해요. 70 ~ 80 사이의 한 가운데 값은 75죠. 그래서 75가 이 계급의 계급값이에요.

계급값 = (계급의 양 끝값의 합) ÷ 2

80 ~ 90의 계급값은 85, 90 ~ 100의 계급값은 95가 되겠죠?

도수

도수는 각 계급에 속하는 변량의 개수예요.

60 ~ 70점에 해당하는 점수는 68점 하나네요. 70 ~ 80점에 해당하는 점수는 72, 76점으로 두 명이에요. 80 ~ 90점에 해당하는 점수는 84, 86, 84 세 명이고, 90 ~ 100점에 해당하는 점수는 92, 96, 92, 96 네 명이에요.

같은 값이 있어도 하나로 세지 않고 각각을 따로 세요.

여기서 60 ~ 70에 해당하는 점수가 하나니까 도수는 1, 70 ~ 80에 해당하는 점수는 두 개니까 도수가 2이고, 80 ~ 90에 해당하는 점수가 세 개니까 도수는 3, 90 ~ 100에 해당하는 점수는 네 개니까 도수가 4예요. 앞 표에서 오른쪽에 있는 게 도수지요.

즉 어떤 계급에 해당하는 자료가 몇 개인가가 바로 도수예요.

도수분포표

마지막으로 도수분포표는 주어진 전체 자료를 몇 개의 계급으로 나누고 각 계급에 속하는 도수를 조사하여 나타낸 표예요. 그러니까 앞 표가 바로 도수분포표예요.

도수분포표를 보면 한 자료가 전체에서 어느 위치에 속하는지를 쉽게 알아볼 수 있어요. 84점이라는 수학 점수가 전체에서 어느 정도나 되는지를 파악하기가 쉽죠. 또 전체 자료의 분포를 파악하는 데도 도움이 돼요.

하지만 자료 하나하나의 특징을 파악하기 어려운 단점도 있어요. 80 ~ 90에 3명이 있는데, 이들의 점수가 몇 점인지는 알 수 없다는 거지요.

함께 보면 좋은 글

줄기와 잎 그림
도수분포표 만드는 법
도수분포표에서의 평균구하기
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법

정리해볼까요

도수분포표

  • 변량: 자료를 수량으로 나타낸 것
  • 계급: 변량을 일정한 간격으로 나눈 구간
  • 계급의 크기: 계급의 구간 너비. (계급의 큰 쪽 끝값) - (계급의 작은 쪽 끝값)
  • 계급값: 각 계급의 중앙값. (계급의 양 끝값의 합) ÷ 2
  • 도수: 각 계급에 해당하는 변량의 개수
  • 도수분포표: 주어진 자료를 몇 개의 계끕으로 나누고 각 계급에 속하는 도수를 조사하여 나타낸 표.
 
그리드형

+ 최근글