계급값
도수분포표에서의 분산과 표준편차
이번에는 도수분포표를 보고 분산과 표준편차를 구하는 방법이에요. 분산과 표준편차에서 얘기한 것처럼 표준편차를 구하려면, 평균 → 편차 → 분산 → 표준편차의 순서대로 구해야 해요.
그런데 도수분포표에서 평균 구하는 방법은 일반적인 평균구하는 방법과 달랐죠? 도수분포표에서의 평균 구하기에서 했던 방법으로 평균을 먼저 구해야 해요. 미리 확인하세요.
이 글에서는 1학년 때 배웠던 도수분포표 관련 내용과 앞에서 배운 산포도의 내용이 모두 총망라돼서 나와요. 산포도 구하는 방법과 공식을 꼭 기억하고 있어야 해요.
도수분포표에서 분산과 표준편차 구하기
도수분포표에서 분산과 표준편차를 구할 때 가장 중요한 것은 도수예요. 일반적인 변량들로 된 자료에서는 각각의 값들을 정확하게 알 수 있어요. 하지만 도수분포표는 정확한 값을 알 수 없기 때문에 계급값을 이용하죠. 그리고 계급값을 이용하여 얻은 값들은 도수가 포함되지 않은 값들이에요. 따라서 값에 도수를 곱해줘야 우리가 원하는 걸 얻을 수 있어요.
뭔 말인지 모르겠죠? 실제로 구해보면서 정리해보죠. 아래같은 도수분포표가 있다고 해볼까요?
점수(점) | 학생 수(명) |
---|---|
60 이상 ~ 70 미만 | 1 |
70 ~ 80 | 3 |
80 ~ 90 | 11 |
90 ~ 100 | 5 |
합계 | 20 |
평균 → 편차 → 분산 → 표준편차를 구해야 해요.
분산과 표준편차를 구할 때는 아래처럼 표를 이용해서 구하는 게 알아보기 쉽고 편해요.
점수 (점) | 학생 수 (명) | 계급값 | 계급값 × 도수 | ②편차 | (편차)2 × 도수 |
---|---|---|---|---|---|
60이상 ~ 70미만 | 1 | 65 | 65 × 1 = 65 | 65 - 85 = -20 | (-20)2 × 1 = 400 |
70 ~ 80 | 3 | 75 | 75 × 3 = 225 | 75 - 85 = -10 | (-10)2 × 3 = 300 |
80 ~ 90 | 11 | 85 | 85 × 11 = 935 | 85 - 85 = 0 | (0)2 × 11 = 0 |
90 ~ 100 | 5 | 95 | 95 × 5 = 475 | 95 - 85 = 10 | (10)2 × 5 = 500 |
합계 | 20 | 65 + 225 + 935 + 475 = 1700 | 400 + 300 + 0 + 500 = 1200 | ||
평균 | ①1700 ÷ 20 = 85 | ③1200 ÷ 20 = 60 |
- 계급값은 각 구간의 양 끝값을 더해서 2로 나눈 값이죠? 도수분포표, 변량, 계급, 계급값, 도수에서 계급값 구하는 방법도 해봤어요. 계급값을 이용해서 평균을 구했더니 85가 나왔네요.
- 평균을 구한 다음에는 편차를 구해야 해요. 편차 구하는 공식의 변량 자리에 계급값을 넣어주세요.
- 편차를 구한 다음에는 분산을 구해야 하는데요. 분산은 편차의 제곱의 평균이라고 했어요. 그런데 도수분포표에서는 편차 제곱에 도수를 구한 것들의 평균이에요. 편차의 제곱에 도수를 꼭 곱해줘야 해요.
일반적인 변량이었다면 각각 편차를 구해서 더했을 텐데, 도수분포표에서는 각각의 편차를 구할 수 없기때문에 대표인 계급값을 이용했던 거거든요. 그런데 같은 계급값을 갖는 변량이 도수의 개수만큼 있잖아요. 특정한 계급값을 대표로 갖는 도수의 개수만큼을 곱해줘야 해당 계급의 변량들의 값을 모두 더한 게 되는 거죠.
편차의 합은 0이라고 했는데, 위 도수분포표에서 편차의 합은 0이 아니에요. 대신 편차에 도수를 곱해서 더하면 0이 되는 겁니다.
각 계급의 (편차)2 × 도수를 구한 다음에 도수의 총합으로 나누면 그게 바로 분산입니다. 분산이 60이 나왔네요. - 마지막으로 표준편차는 분산에 제곱근을 씌운 거니까
가 되네요.
함께 보면 좋은 글
대푯값과 평균, 중앙값, 최빈값
산포도와 편차
분산과 표준편차
[중등수학/중1 수학] - 도수분포표, 변량, 계급, 계급값, 도수
[중등수학/중1 수학] - 도수분포표 만드는 법
[중등수학/중1 수학] - 도수분포표에서의 평균구하기
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포표에 대해서 알아봤어요. 여러 개의 자료로 표를 만들면 자료의 위치나 흐름 등을 쉽게 파악할 수 있는 장점이 있어요.
이번 글에서 공부할 히스토그램은 도수분포표에서 한 발 더 나가서 표가 아니라 그림으로 그리는 거예요. 그림이 글자보다 직관적이고 이해하기가 쉽잖아요.
히스토그램이 무엇인지, 히스토그램을 어떻게 그리는지 알아보죠.
히스토그램
도수분포표는 아래 표처럼 생겼어요. 왼쪽 칸에는 계급을 쓰고 오른쪽 칸에는 도수를 적지요. 제일 아랫줄에는 도수의 총합을 적어요.
아래는 도수분포표 만드는 법에서 사용한 수학 점수를 도수분포표로 나타낸 거예요.
점수(점) | 학생 수(명) |
---|---|
60 이상 ~ 70 미만 | 1 |
70 ~ 80 | 3 |
80 ~ 90 | 10 |
90 ~ 100 | 6 |
합계 | 20 |
이 도수분포표의 왼쪽에 있는 계급을 가로축에, 오른쪽 칸에 있는 도수를 세로축에 표시해서 직사각형 모양으로 나타낸 그래프가 바로 히스토그램이에요.
히스토그램으로 그리면 아래처럼 생겼어요.
히스토그램 그리는 방법
위에서 설명한 것처럼 히스토그램의 가로축에는 도수분포표에서의 계급의 양 끝값을, 세로축에는 도수를 써요. 눈금과 눈금 사이가 아닌 눈금선이 있는 부분에 계급의 양 끝값과 도수를 써야 해요.
그리고 실제 사용하는 계급 앞과 뒤에 한 칸씩을 더 만드세요.
각 계급을 가로로, 도수를 세로로 하는 직사각형을 그려요. 주의할 건 눈금에 다 채워서 그려야 해요. 옆의 직사각형과 바로 붙도록 그립니다. 아래 그림처럼 직사각형 사이가 서로 떨어져 있으면 안 돼요. 앞의 그림은 제대로 된 히스토그램, 아래 그림은 잘못된 히스토그램입니다.
히스토그램의 특징
히스토그램은 그림(그래프)이므로 자료의 분포 상태를 도수분포표보다 좀 더 쉽게 알아볼 수 있어요. 글자보다 그림이 이해하기 쉬운 건 당연하잖아요.
히스토그램에서 한 계급의 직사각형의 넓이를 한 번 구해볼까요? 한 계급에서 가로의 길이는 계급의 크기와 같아요. 세로의 길이는 도수와 같죠. 그래서 직사각형의 넓이는 (계급의 크기) × (계급의 도수)가 되겠죠? 60점 이상 70점 미만의 직사각형의 넓이는 10 × 1 = 10, 70점 이상 80점 미만의 직사각형의 넓이는 10 × 3 = 30 이렇게 구할 수 있죠.
그런데 가로에 있는 계급의 크기는 계급이 달라도 모두 일정해요. 따라서 직사각형의 넓이는 도수에 비례해요.
다음이 중요한 내용인데요. 전체 직사각형의 넓이를 구해볼까요? 각각의 직사각형의 넓이를 다 더하면 되겠죠? 60점 이상 70점 미만은 10, 70점 이상 80점 미만은 30, 80점 이상 90점 미만은 10 × 10 = 100, 90점 이상 100점 미만은 10 × 6 = 60이죠. 10 + 30 + 100 + 60 = 200이네요.
이번에는 (계급의 크기) × (총 도수)를 구해볼까요? 10 × (1 + 3 + 10 + 6) = 10 × 20 = 200이에요. 위에서 구한 직사각형의 넓이와 같죠?
직사각형의 전체 넓이 = {(계급의 크기) × (도수)}의 총합 = (계급의 크기) × (총 도수)
아래 히스토그램을 보고 아래 물음에 답하여라.
(1) 계급값이 85점인 계급의 도수를 구하여라.
(2) 계급값이 95점인 계급의 직사각형의 넓이는 60점 이상 70점 미만인 계급의 직사각형의 넓이의 몇 배인가?
(1)에서 계급값이 85이므로 계급은 80점 이상 90점 미만이 되겠죠? 이 계급에서 막대의 세로가 도수니까 10이네요.
(2)는 계급값이 95점인 계급은 90점 이상 100점 미만인데, 이때의 도수는 6이에요. 60점 이상 70점 미만인 계급의 도수는 1이고요. 넓이는 도수에 비례한다고 했으니까 두 계급의 직사각형의 넓이를 비교할 때는 실제 넓이가 아닌 도수만 비교해도 돼요. 6/1 = 6이라서 넓이는 6배 입니다.
히스토그램과 막대그래프의 차이
히스토그램은 얼핏 보면 막대그래프와 닮았어요. 그런데 왜 막대그래프가 아닌 히스토그램을 그릴까요?
막대그래프는 보통 연속되지 않는 자료들을 그래프로 그릴 때 사용해요. 사과는 몇 개, 수박은 몇 개, 이럴 때 사용하죠. 수박과 사과는 서로 연결할 수 없잖아요.
히스토그램은 60 ~ 70점, 70 ~ 80점, … 처럼 서로 연속된 자료를 나타낼 때 사용합니다. 첫 번째 계급의 끝값인 70점과 두 번째 계급의 70점이 서로 연결되잖아요.
그래프를 보면 가장 눈에 띄는 게 있어요. 히스토그램은 막대가 서로 붙어 있고, 막대그래프는 벌어져 있어요. 위에서 설명한 연속이냐 연속하지 않느냐의 차이 때문에 생기는 건데요. 60 ~ 70, 70 ~ 80은 연속하니까 죽 붙여서 그려야 하는 거지요.
함께 보면 좋은 글
줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표 만드는 법
도수분포표에서의 평균구하기
도수분포다각형, 도수분포다각형 그리는 방법
도수분포표에서의 평균구하기
도수분포표에서 사용하는 용어를 공부했고 도수분포표를 만드는 법도 공부했어요. 도수분포표에서 원하는 정보를 읽어내는 요령도 생겼지요.
이제는 도수분포표를 보고 그 표에 나와 있지 않은 정보를 유추해내는 방법을 공부할 거예요. 바로 도수분포표를 보고 변량의 평균을 구하는 거지요.
도수분포표를 이용해서 구한 평균과 실제 변량의 평균 사이에는 어떤 관계가 있는지도 알아보자고요.
평균
대푯값은 자료의 특징이나 자료 전체의 경향을 대표할 수 있는 값으로 중앙값이나 최빈값 등이 있어요. 중앙값은 계급값을 할 때 살짝 들어본 기억이 나나요? 계급값은 계급의 중앙값, 그러니까 (계급의 양 끝값의 합) ÷ 2라고 했었지요?
대푯값은 딱 하나만 있는 게 아니고 여러 개가 있어요.
평균은 대푯값 중의 하나입니다. 평균 구하는 공식은 모두 알고 있죠?
도수분포표에서 평균 구하기
도수분포표에서 평균을 구할 때는 위 공식에서 오른쪽에 있는 내용을 이용해요.
도수분포표에서는 도수의 총합을 구할 수 있죠? 그런데 변량의 총합을 구할 수 없어요. 변량이 나오지 않으니까요. 그럼 평균을 구할 수 없을까요?
정확한 평균을 구할 수는 없지만 대략적인 평균을 구할 수는 있어요. 도수의 총합은 정확하게 구할 수 있지만 변량의 총합을 구할 수 없으니까 대략적인 변량의 총합을 구하는 거죠.
도수분포표에서 평균을 구할 때는 아래 순서로 해요.
- 각 계급의 계급값을 구한다.
계급값은 위에서 설명한 것처럼 그 계급을 대표하는 대푯값의 한 종류에요. 정확한 값을 구할 수 없으므로 대표할 수 있는 값을 이용합니다. - 각 계급의 (계급값) × (도수)를 구한다.
대푯값인 계급값을 이용해서 계급의 대략적인 총합을 구하는 거예요. 각 계급의 도수는 도수분포표에서 바로 알 수 있죠? - (계급값) × (도수)을 모두 더한다.
계급별로 구한 (계급값) × (도수)를 모두 더하여 변량의 총합을 대신합니다. - (계급값) × (도수)의 총합을 도수의 총합으로 나눈다.
아래는 도수분포표 만드는 법 예제에 있는 변량과 도수분포표에요. 이걸 이용해서 도수분포표에서 평균을 구해보죠.
점수(점) | 학생 수(명) | 계급값 | 계급값 × 도수 |
60 이상 ~ 70 미만 | 1 | 65 | 65 × 1 = 65 |
70 ~ 80 | 3 | 75 | 75 × 3 = 225 |
80 ~ 90 | 10 | 85 | 85 × 10 = 850 |
90 ~ 100 | 6 | 95 | 95 × 6 = 570 |
합계 | 20 | 65 + 225 + 850 + 570 = 1710 |
구하는 평균은 1710 ÷ 20 = 85.5군요.
변량을 이용해서 실제 평균을 구해볼까요? 역시 같은 예제에 있는 변량입니다.
92 88 76 90 96
72 84 82 86 74
90 86 94 88 68
82 84 86 98 84
20개의 값을 다 더한 다음에 20으로 나눠볼게요. 다 더했더니 1700이네요. 1700 ÷ 20 = 85군요.
실제로 구한 평균과 도수분포표를 이용해서 구한 평균이 다르죠? 도수분포표를 이용한 평균은 정확하진 않지만 차이가 많이 나지 않아서 변량의 분포라든가 위치 등을 파악하는데 큰 어려움은 없어요.
함께 보면 좋은 글
줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표 만드는 법
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법
도수분포표 만드는 법
도수분포표를 만드는 법을 공부해볼 거예요. 사실 도수분포표를 만드는 방법은 따로 공부하지 않아도 할 수는 있어요. 하지만 만드는 법을 공부하면 좀 더 체계적이고 더 많은 정보를 더 정확하게 줄 수 있는 도수분포표를 만들 수 있어요.
도수분포표를 만들기에 앞서 도수분포표에서 사용하는 용어들에 대해서 정확히 이해를 해야 해요. 혹시 이해되지 않는다면 도수분포표, 변량, 계급, 계급값, 도수를 한 번 읽어보세요.
도수분포표를 만드는 순서
- 주어진 자료에서 가장 큰 변량과 가장 작은 변량을 찾는다.
- 가장 큰 변량과 가장 작은 변량이 포함될 수 있는 계급을 만든다.
계급은 OO 이상 ~ OO 미만이 되도록 하고, 계급의 크기가 모두 같아야 합니다.
계급의 개수는 5 ~ 15개 정도가 적당해요. - 각 계급에 속하는 변량의 개수를 세어 계급의 도수를 구한다.
2번에서 OO 이상 ~ OO 미만은 첫 번째 계급에만 적어주면 돼요.
3번에서 각 계급에 속하는 도수를 모두 더한 것이 전체 변량의 개수와 같은지 확인하세요. 빼먹은 것이 있거나 두 번 센 것이 있는지 확인하는 과정이에요.
다음 수학 점수를 이용하여 도수분포표를 만들고, 물음에 답하여라.
92 88 76 90 96
72 84 82 86 74
90 86 94 88 68
82 84 86 98 84
(1) 계급의 개수를 구하여라.
(2) 점수가 82점인 학생이 속하는 계급을 구하여라.
(3) 점수가 10번째로 높은 학생이 속하는 계급의 계급값을 구하여라.
(4) 도수가 가장 작은 계급을 구하여라.
도수분포표를 만드는 첫 단계는 변량 중에서 가장 큰 것과 가장 작은 것을 찾는 거예요. 가장 큰 변량은 마지막 줄 네 번째에 있는 98이고 가장 작은 변량은 세 번째 줄 마지막 68이네요.
계급을 나누는데, 계급의 크기를 10으로 만들어볼까요? 물론 5로 해도 상관은 없어요. 계급의 크기를 10으로 하는데, 68과 98이 들어가야 하니까 처음 계급은 60점 이상 ~ 70점 미만이 되어야겠고, 마지막 계급은 90점 이상 100점 미만으로 해야겠네요.
계급을 나누고 계급에 해당하는 점수를 적어보죠.
60 ~ 70 : 68 (한 개)
70 ~ 80 : 76, 72, 74 (세 개)
80 ~ 90 : 88, 84, 82, 86, 86, 88, 82, 84, 86, 84(열 개)
90 ~ 100 : 92, 90, 96, 90, 94, 98(여섯 개)
괄호안의 숫자를 다 더해보면 20개가 되어서 문제에서 준 변량의 개수와 똑같죠?
각 계급에 해당하는 점수의 개수, 즉 도수를 구했으니 표로 만들어볼까요?
점수(점) | 학생 수(명) |
---|---|
60 이상 ~ 70 미만 | 1 |
70 ~ 80 | 3 |
80 ~ 90 | 10 |
90 ~ 100 | 6 |
합계 | 20 |
(1) 계급의 개수는 60 ~ 70, 70 ~ 80, 80 ~ 90, 90 ~ 100 이렇게 네 개군요.
(2) 점수가 82점인 학생이 속하는 계급은 80점 이상 90점 미만이고요.
(3) 점수가 10번째로 높은 학생이 속하는 계급은 80점 이상 90점 미만이네요. 계급값은 양 끝값을 더해서 2로 나누어준 것이니까 (80 + 90) ÷ 2 = 85점이군요.
(4) 도수가 가장 작은 계급은 도수가 1인 60점 이상 70점 미만이네요.
함께 보면 좋은 글
줄기와 잎 그림
도수분포표, 변량, 계급, 계급값, 도수
도수분포표에서의 평균구하기
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법
도수분포표, 변량, 계급, 계급값, 도수
새로운 단원은 통계입니다. 통계는 비교적 어려운 단원이에요.
새로운 용어가 많이 나오는 데다 비슷비슷해서 헛갈리기도 쉽지요. 용어의 뜻을 정확히 알아야 해요. 문제에 나오거나 설명하는 단어를 제대로 이해하지 못하면 문제를 풀 수가 없거든요.
용어를 설명하다 보니까 약간 딱딱할 수 있어요. 용어를 이해한다고 하는 게 꼭 여기에 나온 표현대로 뜻을 이해할 필요는 없어요. 자기 나름대로 표현 방식으로 단어의 뜻을 이해하세요.
들어가기 전에
열 명의 1학기 기말고사 시험 수학 점수가 있어요. 92, 84, 88, 76, 96, 72, 92, 84, 68, 96점을 받았다고 해보죠.
70점대 몇 명, 80점대 몇 명 … 이런 식으로 점수대별로 몇 명이나 있는지 표를 만들어볼게요.
점수(점) | 학생 수(명) |
---|---|
60 이상 ~ 70 미만 | 1 |
70 ~ 80 | 2 |
80 ~ 90 | 3 |
90 ~ 100 | 4 |
합계 | 10 |
10명의 점수를 주면 여러분은 위 표처럼 나타낼 수 있죠?
이번 글에서 우리가 공부할 게 뭐냐면 바로 위 표에서 사용하는 용어들이에요. 용어를 모른다고 해서 표를 못 만드는 건 아니에요. 하지만 용어를 알면 표를 더 쉽고 정확하게 만들 수 있죠. 또 표에서 좀 더 정확한 정보를 읽어낼 수도 있어요.
변량, 계급, 계급값, 계급의 크기, 도수, 도수분포표
변량
변량은 점수, 시간 같은 여러 자료를 수량으로 나타낸 것을 말해요. 그냥 자료를 쭉 적어놓은 거로 생각하면 쉬워요.
위에서는 수학 점수 92, 84, 88, 76, 96, … 이렇게 쭉 쓰여 있는 게 변량이에요.
계급
계급은 변량을 일정한 간격으로 나눈 구간이에요.
70점대 몇 명, 80점대 몇 명 … 이런 식으로 점수대별로 학생 수를 알아보려면 어떻게 했죠? 70 ~ 80, 80 ~ 90, 90 ~ 100 이렇게 점수를 나눴잖아요. 이렇게 점수별로 나누어 놓은 구간이 계급이에요. 위의 표에서 왼쪽에 있는 게 계급이에요.
계급의 크기라는 용어도 있어요. 계급의 크기는 계급의 간격(너비)을 말해요.
위 예에서 70 ~ 80이라는 계급이 있었어요. 여기서 계급의 크기는 10이에요. 70과 80 사이는 10의 차이가 있잖아요.
계급의 크기 = (계급의 큰 쪽 끝값) - (계급의 작은 쪽 끝값)
중요한 건 계급의 크기는 모두 같다는 거예요. 한 계급이 70 ~ 80이었으면 그다음 계급은 80 ~ 90이 되어야 해요. 70 ~ 80, 80 ~ 85 이렇게 크기가 다르게 계급을 나누면 안돼요.
계급값은 계급을 대표하는 값으로 각 계급의 한가운데 값(중앙값)을 말해요. 70 ~ 80 사이의 한 가운데 값은 75죠. 그래서 75가 이 계급의 계급값이에요.
계급값 = (계급의 양 끝값의 합) ÷ 2
80 ~ 90의 계급값은 85, 90 ~ 100의 계급값은 95가 되겠죠?
도수
도수는 각 계급에 속하는 변량의 개수예요.
60 ~ 70점에 해당하는 점수는 68점 하나네요. 70 ~ 80점에 해당하는 점수는 72, 76점으로 두 명이에요. 80 ~ 90점에 해당하는 점수는 84, 86, 84 세 명이고, 90 ~ 100점에 해당하는 점수는 92, 96, 92, 96 네 명이에요.
같은 값이 있어도 하나로 세지 않고 각각을 따로 세요.
여기서 60 ~ 70에 해당하는 점수가 하나니까 도수는 1, 70 ~ 80에 해당하는 점수는 두 개니까 도수가 2이고, 80 ~ 90에 해당하는 점수가 세 개니까 도수는 3, 90 ~ 100에 해당하는 점수는 네 개니까 도수가 4예요. 앞 표에서 오른쪽에 있는 게 도수지요.
즉 어떤 계급에 해당하는 자료가 몇 개인가가 바로 도수예요.
도수분포표
마지막으로 도수분포표는 주어진 전체 자료를 몇 개의 계급으로 나누고 각 계급에 속하는 도수를 조사하여 나타낸 표예요. 그러니까 앞 표가 바로 도수분포표예요.
도수분포표를 보면 한 자료가 전체에서 어느 위치에 속하는지를 쉽게 알아볼 수 있어요. 84점이라는 수학 점수가 전체에서 어느 정도나 되는지를 파악하기가 쉽죠. 또 전체 자료의 분포를 파악하는 데도 도움이 돼요.
하지만 자료 하나하나의 특징을 파악하기 어려운 단점도 있어요. 80 ~ 90에 3명이 있는데, 이들의 점수가 몇 점인지는 알 수 없다는 거지요.
함께 보면 좋은 글
줄기와 잎 그림
도수분포표 만드는 법
도수분포표에서의 평균구하기
히스토그램과 히스토그램의 특징, 히스토그램 그리기
도수분포다각형, 도수분포다각형 그리는 방법