계급
누적도수와 누적도수의 분포표
이번 글에서 배울 용어는 누적도수라는 용어에요. 도수, 상대도수에서 사용하는 도수와 같은 도수인데, 앞에 누적이라는 말이 붙어있죠? 국어사전에서 누적이라는 말은 "포개어 여러 번 쌓음"이라고 되어있네요.
즉, 누적도수는 도수를 계속 쌓아가는 걸 말해요. 도수분포표에서 처음 계급부터 어떤 계급까지의 도수를 차례대로 더한 값이에요. 쉽게 말해서 계급의 도수에 앞에 있는 계급의 도수까지 모두 더한다고 생각하면 돼요.
어떤 계급의 누적도수 = 그 계급의 도수 + 처음 계급부터 앞 계급까지의 도수의 합
= 그 계급의 도수 + 앞 계급의 누적도수
아래 표에서 왼쪽은 시험 점수를 10점 단위로 나눈 계급이고, 가운데는 점수별 학생 수에요. 오른쪽에는 누적도수를 나타낸 겁니다. 이 표처럼 각 계급의 누적도수를 표로 나타낸 것을 누적도수의 분포표라고 해요.
점수(점) | 학생 수(명) | 누적 도수(명) |
---|---|---|
60 이상 ~ 70 미만 | 1 | 1 |
70 ~ 80 | 3 | 1 + 3 = 4 |
80 ~ 90 | 10 | 1 + 3 + 10 = 14 4 + 10 = 14 |
90 ~ 100 | 6 | 1 + 3 + 10 + 6 = 20 14 + 6 = 20 |
합계 | 20 |
제일 처음 계급인 60점 이상 70점 미만인 학생 수는 1명이에요. 이보다 앞에는 계급이 없으니까 누적도수는 1이지요.
두 번째 70점 이상 80점 미만인 학생 수는 3명이에요. 이보다 앞에는 60점 이상 70점 미만이라는 계급이 있고 도수가 1이에요. 그래서 1 + 3 = 4라는 누적도수를 갖게 돼요.
세 번째 80점 이상 90점 미만인 학생 수는 10명이에요. 이보다 앞에는 60점 이상 70점 미만, 70점 이상 80점 미만이라는 두 개의 계급이 있고, 이 계급에는 각각 1, 3이라는 도수가 있어요. 1 + 3 + 10 = 14라는 누적도수를 갖게 돼요. 사실 70점 이상 80점 미만의 누적도수가 4였기 때문에 그냥 4 + 10 = 14로 계산해도 돼요.
네 번째 90점 이상 100점 미만인 학생 수는 6명이죠. 이보다 앞에는 60점 이상 70점 미만, 70점 이상 80점 미만, 80점 이상 90점 미만이라는 세 개의 계급이 있고, 이 세 계급의 누적도수는 14지요. 그래서 누적도수는 14 + 6 = 20이에요.
누적도수의 특징
누적도수에는 두 가지 큰 특징이 있어요. 첫 번째 그림인 누적도수의 분포표에서 빨간색으로 표시된 곳이요.
- 첫 번째 계급은 누적도수 = 도수
- 마지막 계급의 누적도수 = 도수의 총합
첫 번째 계급은 앞 계급이 없으니까 더할 게 0이어서 누적도수와 계급의 도수가 같아요.
마지막 계급의 누적도수는 그 이후로 더할 게 없죠. 더할 수 있는 건 다 더했다는 거예요. 그래서 총 도수와 마지막 계급의 누적도수가 같아요. 마지막 계급의 누적도수와 총 도수가 같으니까 누적도수의 합계란에는 빈 칸으로 두는 거예요.
누적도수는 어떤 대상이 자료 전체에서 차지하는 위치를 알고 싶을 때 사용해요. 예를 들어 90점인 학생은 전체에서 몇 등인가를 구할 때 그냥 도수분포표보다 훨씬 편리하지요.
아래 누적도수의 분포표를 보고, A, B, C, D의 값을 구하여라.
점수(점) | 학생 수(명) | 누적 도수(명) |
---|---|---|
60 이상 ~ 70 미만 | 2 | A |
70 ~ 80 | 3 | B |
80 ~ 90 | C | 16 |
90 ~ 100 | 4 | 20 |
합계 | D |
A는 첫 번째 계급의 누적도수이므로 계급의 도수와 같아요. A = 2네요.
B는 계급의 도수인 3과 앞 계급의 누적도수 A = 2를 더해서 5가 되고요.
C는 그냥 도수죠. 앞 계급의 누적도수인 5와 C를 더해서 16이어야 하므로 C = 11이어야 하고요.
D는 총 도수인데, 총 도수는 마지막 계급의 누적도수와 같죠? 마지막 계급의 누적도수가 20이므로 총 도수도 20입니다.
함께 보면 좋은 글
도수분포표, 변량, 계급, 계급값, 도수
도수분포다각형, 도수분포다각형 그리는 방법
상대도수와 상대도수의 분포표
상대도수의 그래프
누적도수의 그래프, 누적도수 그래프 그리는 방법
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포표에 대해서 알아봤어요. 여러 개의 자료로 표를 만들면 자료의 위치나 흐름 등을 쉽게 파악할 수 있는 장점이 있어요.
이번 글에서 공부할 히스토그램은 도수분포표에서 한 발 더 나가서 표가 아니라 그림으로 그리는 거예요. 그림이 글자보다 직관적이고 이해하기가 쉽잖아요.
히스토그램이 무엇인지, 히스토그램을 어떻게 그리는지 알아보죠.
히스토그램
도수분포표는 아래 표처럼 생겼어요. 왼쪽 칸에는 계급을 쓰고 오른쪽 칸에는 도수를 적지요. 제일 아랫줄에는 도수의 총합을 적어요.
아래는 도수분포표 만드는 법에서 사용한 수학 점수를 도수분포표로 나타낸 거예요.
점수(점) | 학생 수(명) |
---|---|
60 이상 ~ 70 미만 | 1 |
70 ~ 80 | 3 |
80 ~ 90 | 10 |
90 ~ 100 | 6 |
합계 | 20 |
이 도수분포표의 왼쪽에 있는 계급을 가로축에, 오른쪽 칸에 있는 도수를 세로축에 표시해서 직사각형 모양으로 나타낸 그래프가 바로 히스토그램이에요.
히스토그램으로 그리면 아래처럼 생겼어요.
히스토그램 그리는 방법
위에서 설명한 것처럼 히스토그램의 가로축에는 도수분포표에서의 계급의 양 끝값을, 세로축에는 도수를 써요. 눈금과 눈금 사이가 아닌 눈금선이 있는 부분에 계급의 양 끝값과 도수를 써야 해요.
그리고 실제 사용하는 계급 앞과 뒤에 한 칸씩을 더 만드세요.
각 계급을 가로로, 도수를 세로로 하는 직사각형을 그려요. 주의할 건 눈금에 다 채워서 그려야 해요. 옆의 직사각형과 바로 붙도록 그립니다. 아래 그림처럼 직사각형 사이가 서로 떨어져 있으면 안 돼요. 앞의 그림은 제대로 된 히스토그램, 아래 그림은 잘못된 히스토그램입니다.
히스토그램의 특징
히스토그램은 그림(그래프)이므로 자료의 분포 상태를 도수분포표보다 좀 더 쉽게 알아볼 수 있어요. 글자보다 그림이 이해하기 쉬운 건 당연하잖아요.
히스토그램에서 한 계급의 직사각형의 넓이를 한 번 구해볼까요? 한 계급에서 가로의 길이는 계급의 크기와 같아요. 세로의 길이는 도수와 같죠. 그래서 직사각형의 넓이는 (계급의 크기) × (계급의 도수)가 되겠죠? 60점 이상 70점 미만의 직사각형의 넓이는 10 × 1 = 10, 70점 이상 80점 미만의 직사각형의 넓이는 10 × 3 = 30 이렇게 구할 수 있죠.
그런데 가로에 있는 계급의 크기는 계급이 달라도 모두 일정해요. 따라서 직사각형의 넓이는 도수에 비례해요.
다음이 중요한 내용인데요. 전체 직사각형의 넓이를 구해볼까요? 각각의 직사각형의 넓이를 다 더하면 되겠죠? 60점 이상 70점 미만은 10, 70점 이상 80점 미만은 30, 80점 이상 90점 미만은 10 × 10 = 100, 90점 이상 100점 미만은 10 × 6 = 60이죠. 10 + 30 + 100 + 60 = 200이네요.
이번에는 (계급의 크기) × (총 도수)를 구해볼까요? 10 × (1 + 3 + 10 + 6) = 10 × 20 = 200이에요. 위에서 구한 직사각형의 넓이와 같죠?
직사각형의 전체 넓이 = {(계급의 크기) × (도수)}의 총합 = (계급의 크기) × (총 도수)
아래 히스토그램을 보고 아래 물음에 답하여라.
(1) 계급값이 85점인 계급의 도수를 구하여라.
(2) 계급값이 95점인 계급의 직사각형의 넓이는 60점 이상 70점 미만인 계급의 직사각형의 넓이의 몇 배인가?
(1)에서 계급값이 85이므로 계급은 80점 이상 90점 미만이 되겠죠? 이 계급에서 막대의 세로가 도수니까 10이네요.
(2)는 계급값이 95점인 계급은 90점 이상 100점 미만인데, 이때의 도수는 6이에요. 60점 이상 70점 미만인 계급의 도수는 1이고요. 넓이는 도수에 비례한다고 했으니까 두 계급의 직사각형의 넓이를 비교할 때는 실제 넓이가 아닌 도수만 비교해도 돼요. 6/1 = 6이라서 넓이는 6배 입니다.
히스토그램과 막대그래프의 차이
히스토그램은 얼핏 보면 막대그래프와 닮았어요. 그런데 왜 막대그래프가 아닌 히스토그램을 그릴까요?
막대그래프는 보통 연속되지 않는 자료들을 그래프로 그릴 때 사용해요. 사과는 몇 개, 수박은 몇 개, 이럴 때 사용하죠. 수박과 사과는 서로 연결할 수 없잖아요.
히스토그램은 60 ~ 70점, 70 ~ 80점, … 처럼 서로 연속된 자료를 나타낼 때 사용합니다. 첫 번째 계급의 끝값인 70점과 두 번째 계급의 70점이 서로 연결되잖아요.
그래프를 보면 가장 눈에 띄는 게 있어요. 히스토그램은 막대가 서로 붙어 있고, 막대그래프는 벌어져 있어요. 위에서 설명한 연속이냐 연속하지 않느냐의 차이 때문에 생기는 건데요. 60 ~ 70, 70 ~ 80은 연속하니까 죽 붙여서 그려야 하는 거지요.
함께 보면 좋은 글
줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표 만드는 법
도수분포표에서의 평균구하기
도수분포다각형, 도수분포다각형 그리는 방법
도수분포표에서의 평균구하기
도수분포표에서 사용하는 용어를 공부했고 도수분포표를 만드는 법도 공부했어요. 도수분포표에서 원하는 정보를 읽어내는 요령도 생겼지요.
이제는 도수분포표를 보고 그 표에 나와 있지 않은 정보를 유추해내는 방법을 공부할 거예요. 바로 도수분포표를 보고 변량의 평균을 구하는 거지요.
도수분포표를 이용해서 구한 평균과 실제 변량의 평균 사이에는 어떤 관계가 있는지도 알아보자고요.
평균
대푯값은 자료의 특징이나 자료 전체의 경향을 대표할 수 있는 값으로 중앙값이나 최빈값 등이 있어요. 중앙값은 계급값을 할 때 살짝 들어본 기억이 나나요? 계급값은 계급의 중앙값, 그러니까 (계급의 양 끝값의 합) ÷ 2라고 했었지요?
대푯값은 딱 하나만 있는 게 아니고 여러 개가 있어요.
평균은 대푯값 중의 하나입니다. 평균 구하는 공식은 모두 알고 있죠?
도수분포표에서 평균 구하기
도수분포표에서 평균을 구할 때는 위 공식에서 오른쪽에 있는 내용을 이용해요.
도수분포표에서는 도수의 총합을 구할 수 있죠? 그런데 변량의 총합을 구할 수 없어요. 변량이 나오지 않으니까요. 그럼 평균을 구할 수 없을까요?
정확한 평균을 구할 수는 없지만 대략적인 평균을 구할 수는 있어요. 도수의 총합은 정확하게 구할 수 있지만 변량의 총합을 구할 수 없으니까 대략적인 변량의 총합을 구하는 거죠.
도수분포표에서 평균을 구할 때는 아래 순서로 해요.
- 각 계급의 계급값을 구한다.
계급값은 위에서 설명한 것처럼 그 계급을 대표하는 대푯값의 한 종류에요. 정확한 값을 구할 수 없으므로 대표할 수 있는 값을 이용합니다. - 각 계급의 (계급값) × (도수)를 구한다.
대푯값인 계급값을 이용해서 계급의 대략적인 총합을 구하는 거예요. 각 계급의 도수는 도수분포표에서 바로 알 수 있죠? - (계급값) × (도수)을 모두 더한다.
계급별로 구한 (계급값) × (도수)를 모두 더하여 변량의 총합을 대신합니다. - (계급값) × (도수)의 총합을 도수의 총합으로 나눈다.
아래는 도수분포표 만드는 법 예제에 있는 변량과 도수분포표에요. 이걸 이용해서 도수분포표에서 평균을 구해보죠.
점수(점) | 학생 수(명) | 계급값 | 계급값 × 도수 |
60 이상 ~ 70 미만 | 1 | 65 | 65 × 1 = 65 |
70 ~ 80 | 3 | 75 | 75 × 3 = 225 |
80 ~ 90 | 10 | 85 | 85 × 10 = 850 |
90 ~ 100 | 6 | 95 | 95 × 6 = 570 |
합계 | 20 | 65 + 225 + 850 + 570 = 1710 |
구하는 평균은 1710 ÷ 20 = 85.5군요.
변량을 이용해서 실제 평균을 구해볼까요? 역시 같은 예제에 있는 변량입니다.
92 88 76 90 96
72 84 82 86 74
90 86 94 88 68
82 84 86 98 84
20개의 값을 다 더한 다음에 20으로 나눠볼게요. 다 더했더니 1700이네요. 1700 ÷ 20 = 85군요.
실제로 구한 평균과 도수분포표를 이용해서 구한 평균이 다르죠? 도수분포표를 이용한 평균은 정확하진 않지만 차이가 많이 나지 않아서 변량의 분포라든가 위치 등을 파악하는데 큰 어려움은 없어요.
함께 보면 좋은 글
줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표 만드는 법
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법
도수분포표 만드는 법
도수분포표를 만드는 법을 공부해볼 거예요. 사실 도수분포표를 만드는 방법은 따로 공부하지 않아도 할 수는 있어요. 하지만 만드는 법을 공부하면 좀 더 체계적이고 더 많은 정보를 더 정확하게 줄 수 있는 도수분포표를 만들 수 있어요.
도수분포표를 만들기에 앞서 도수분포표에서 사용하는 용어들에 대해서 정확히 이해를 해야 해요. 혹시 이해되지 않는다면 도수분포표, 변량, 계급, 계급값, 도수를 한 번 읽어보세요.
도수분포표를 만드는 순서
- 주어진 자료에서 가장 큰 변량과 가장 작은 변량을 찾는다.
- 가장 큰 변량과 가장 작은 변량이 포함될 수 있는 계급을 만든다.
계급은 OO 이상 ~ OO 미만이 되도록 하고, 계급의 크기가 모두 같아야 합니다.
계급의 개수는 5 ~ 15개 정도가 적당해요. - 각 계급에 속하는 변량의 개수를 세어 계급의 도수를 구한다.
2번에서 OO 이상 ~ OO 미만은 첫 번째 계급에만 적어주면 돼요.
3번에서 각 계급에 속하는 도수를 모두 더한 것이 전체 변량의 개수와 같은지 확인하세요. 빼먹은 것이 있거나 두 번 센 것이 있는지 확인하는 과정이에요.
다음 수학 점수를 이용하여 도수분포표를 만들고, 물음에 답하여라.
92 88 76 90 96
72 84 82 86 74
90 86 94 88 68
82 84 86 98 84
(1) 계급의 개수를 구하여라.
(2) 점수가 82점인 학생이 속하는 계급을 구하여라.
(3) 점수가 10번째로 높은 학생이 속하는 계급의 계급값을 구하여라.
(4) 도수가 가장 작은 계급을 구하여라.
도수분포표를 만드는 첫 단계는 변량 중에서 가장 큰 것과 가장 작은 것을 찾는 거예요. 가장 큰 변량은 마지막 줄 네 번째에 있는 98이고 가장 작은 변량은 세 번째 줄 마지막 68이네요.
계급을 나누는데, 계급의 크기를 10으로 만들어볼까요? 물론 5로 해도 상관은 없어요. 계급의 크기를 10으로 하는데, 68과 98이 들어가야 하니까 처음 계급은 60점 이상 ~ 70점 미만이 되어야겠고, 마지막 계급은 90점 이상 100점 미만으로 해야겠네요.
계급을 나누고 계급에 해당하는 점수를 적어보죠.
60 ~ 70 : 68 (한 개)
70 ~ 80 : 76, 72, 74 (세 개)
80 ~ 90 : 88, 84, 82, 86, 86, 88, 82, 84, 86, 84(열 개)
90 ~ 100 : 92, 90, 96, 90, 94, 98(여섯 개)
괄호안의 숫자를 다 더해보면 20개가 되어서 문제에서 준 변량의 개수와 똑같죠?
각 계급에 해당하는 점수의 개수, 즉 도수를 구했으니 표로 만들어볼까요?
점수(점) | 학생 수(명) |
---|---|
60 이상 ~ 70 미만 | 1 |
70 ~ 80 | 3 |
80 ~ 90 | 10 |
90 ~ 100 | 6 |
합계 | 20 |
(1) 계급의 개수는 60 ~ 70, 70 ~ 80, 80 ~ 90, 90 ~ 100 이렇게 네 개군요.
(2) 점수가 82점인 학생이 속하는 계급은 80점 이상 90점 미만이고요.
(3) 점수가 10번째로 높은 학생이 속하는 계급은 80점 이상 90점 미만이네요. 계급값은 양 끝값을 더해서 2로 나누어준 것이니까 (80 + 90) ÷ 2 = 85점이군요.
(4) 도수가 가장 작은 계급은 도수가 1인 60점 이상 70점 미만이네요.
함께 보면 좋은 글
줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표에서의 평균구하기
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법
도수분포표, 변량, 계급, 계급값, 도수
새로운 단원은 통계입니다. 통계는 비교적 어려운 단원이에요.
새로운 용어가 많이 나오는 데다 비슷비슷해서 헛갈리기도 쉽지요. 용어의 뜻을 정확히 알아야 해요. 문제에 나오거나 설명하는 단어를 제대로 이해하지 못하면 문제를 풀 수가 없거든요.
용어를 설명하다 보니까 약간 딱딱할 수 있어요. 용어를 이해한다고 하는 게 꼭 여기에 나온 표현대로 뜻을 이해할 필요는 없어요. 자기 나름대로 표현 방식으로 단어의 뜻을 이해하세요.
들어가기 전에
열 명의 1학기 기말고사 시험 수학 점수가 있어요. 92, 84, 88, 76, 96, 72, 92, 84, 68, 96점을 받았다고 해보죠.
70점대 몇 명, 80점대 몇 명 … 이런 식으로 점수대별로 몇 명이나 있는지 표를 만들어볼게요.
점수(점) | 학생 수(명) |
---|---|
60 이상 ~ 70 미만 | 1 |
70 ~ 80 | 2 |
80 ~ 90 | 3 |
90 ~ 100 | 4 |
합계 | 10 |
10명의 점수를 주면 여러분은 위 표처럼 나타낼 수 있죠?
이번 글에서 우리가 공부할 게 뭐냐면 바로 위 표에서 사용하는 용어들이에요. 용어를 모른다고 해서 표를 못 만드는 건 아니에요. 하지만 용어를 알면 표를 더 쉽고 정확하게 만들 수 있죠. 또 표에서 좀 더 정확한 정보를 읽어낼 수도 있어요.
변량, 계급, 계급값, 계급의 크기, 도수, 도수분포표
변량
변량은 점수, 시간 같은 여러 자료를 수량으로 나타낸 것을 말해요. 그냥 자료를 쭉 적어놓은 거로 생각하면 쉬워요.
위에서는 수학 점수 92, 84, 88, 76, 96, … 이렇게 쭉 쓰여 있는 게 변량이에요.
계급
계급은 변량을 일정한 간격으로 나눈 구간이에요.
70점대 몇 명, 80점대 몇 명 … 이런 식으로 점수대별로 학생 수를 알아보려면 어떻게 했죠? 70 ~ 80, 80 ~ 90, 90 ~ 100 이렇게 점수를 나눴잖아요. 이렇게 점수별로 나누어 놓은 구간이 계급이에요. 위의 표에서 왼쪽에 있는 게 계급이에요.
계급의 크기라는 용어도 있어요. 계급의 크기는 계급의 간격(너비)을 말해요.
위 예에서 70 ~ 80이라는 계급이 있었어요. 여기서 계급의 크기는 10이에요. 70과 80 사이는 10의 차이가 있잖아요.
계급의 크기 = (계급의 큰 쪽 끝값) - (계급의 작은 쪽 끝값)
중요한 건 계급의 크기는 모두 같다는 거예요. 한 계급이 70 ~ 80이었으면 그다음 계급은 80 ~ 90이 되어야 해요. 70 ~ 80, 80 ~ 85 이렇게 크기가 다르게 계급을 나누면 안돼요.
계급값은 계급을 대표하는 값으로 각 계급의 한가운데 값(중앙값)을 말해요. 70 ~ 80 사이의 한 가운데 값은 75죠. 그래서 75가 이 계급의 계급값이에요.
계급값 = (계급의 양 끝값의 합) ÷ 2
80 ~ 90의 계급값은 85, 90 ~ 100의 계급값은 95가 되겠죠?
도수
도수는 각 계급에 속하는 변량의 개수예요.
60 ~ 70점에 해당하는 점수는 68점 하나네요. 70 ~ 80점에 해당하는 점수는 72, 76점으로 두 명이에요. 80 ~ 90점에 해당하는 점수는 84, 86, 84 세 명이고, 90 ~ 100점에 해당하는 점수는 92, 96, 92, 96 네 명이에요.
같은 값이 있어도 하나로 세지 않고 각각을 따로 세요.
여기서 60 ~ 70에 해당하는 점수가 하나니까 도수는 1, 70 ~ 80에 해당하는 점수는 두 개니까 도수가 2이고, 80 ~ 90에 해당하는 점수가 세 개니까 도수는 3, 90 ~ 100에 해당하는 점수는 네 개니까 도수가 4예요. 앞 표에서 오른쪽에 있는 게 도수지요.
즉 어떤 계급에 해당하는 자료가 몇 개인가가 바로 도수예요.
도수분포표
마지막으로 도수분포표는 주어진 전체 자료를 몇 개의 계급으로 나누고 각 계급에 속하는 도수를 조사하여 나타낸 표예요. 그러니까 앞 표가 바로 도수분포표예요.
도수분포표를 보면 한 자료가 전체에서 어느 위치에 속하는지를 쉽게 알아볼 수 있어요. 84점이라는 수학 점수가 전체에서 어느 정도나 되는지를 파악하기가 쉽죠. 또 전체 자료의 분포를 파악하는 데도 도움이 돼요.
하지만 자료 하나하나의 특징을 파악하기 어려운 단점도 있어요. 80 ~ 90에 3명이 있는데, 이들의 점수가 몇 점인지는 알 수 없다는 거지요.
함께 보면 좋은 글
줄기와 잎 그림
도수분포표 만드는 법
도수분포표에서의 평균구하기
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법