분산
도수분포표에서의 분산과 표준편차
이번에는 도수분포표를 보고 분산과 표준편차를 구하는 방법이에요. 분산과 표준편차에서 얘기한 것처럼 표준편차를 구하려면, 평균 → 편차 → 분산 → 표준편차의 순서대로 구해야 해요.
그런데 도수분포표에서 평균 구하는 방법은 일반적인 평균구하는 방법과 달랐죠? 도수분포표에서의 평균 구하기에서 했던 방법으로 평균을 먼저 구해야 해요. 미리 확인하세요.
이 글에서는 1학년 때 배웠던 도수분포표 관련 내용과 앞에서 배운 산포도의 내용이 모두 총망라돼서 나와요. 산포도 구하는 방법과 공식을 꼭 기억하고 있어야 해요.
도수분포표에서 분산과 표준편차 구하기
도수분포표에서 분산과 표준편차를 구할 때 가장 중요한 것은 도수예요. 일반적인 변량들로 된 자료에서는 각각의 값들을 정확하게 알 수 있어요. 하지만 도수분포표는 정확한 값을 알 수 없기 때문에 계급값을 이용하죠. 그리고 계급값을 이용하여 얻은 값들은 도수가 포함되지 않은 값들이에요. 따라서 값에 도수를 곱해줘야 우리가 원하는 걸 얻을 수 있어요.
뭔 말인지 모르겠죠? 실제로 구해보면서 정리해보죠. 아래같은 도수분포표가 있다고 해볼까요?
점수(점) | 학생 수(명) |
---|---|
60 이상 ~ 70 미만 | 1 |
70 ~ 80 | 3 |
80 ~ 90 | 11 |
90 ~ 100 | 5 |
합계 | 20 |
평균 → 편차 → 분산 → 표준편차를 구해야 해요.
분산과 표준편차를 구할 때는 아래처럼 표를 이용해서 구하는 게 알아보기 쉽고 편해요.
점수 (점) | 학생 수 (명) | 계급값 | 계급값 × 도수 | ②편차 | (편차)2 × 도수 |
---|---|---|---|---|---|
60이상 ~ 70미만 | 1 | 65 | 65 × 1 = 65 | 65 - 85 = -20 | (-20)2 × 1 = 400 |
70 ~ 80 | 3 | 75 | 75 × 3 = 225 | 75 - 85 = -10 | (-10)2 × 3 = 300 |
80 ~ 90 | 11 | 85 | 85 × 11 = 935 | 85 - 85 = 0 | (0)2 × 11 = 0 |
90 ~ 100 | 5 | 95 | 95 × 5 = 475 | 95 - 85 = 10 | (10)2 × 5 = 500 |
합계 | 20 | 65 + 225 + 935 + 475 = 1700 | 400 + 300 + 0 + 500 = 1200 | ||
평균 | ①1700 ÷ 20 = 85 | ③1200 ÷ 20 = 60 |
- 계급값은 각 구간의 양 끝값을 더해서 2로 나눈 값이죠? 도수분포표, 변량, 계급, 계급값, 도수에서 계급값 구하는 방법도 해봤어요. 계급값을 이용해서 평균을 구했더니 85가 나왔네요.
- 평균을 구한 다음에는 편차를 구해야 해요. 편차 구하는 공식의 변량 자리에 계급값을 넣어주세요.
- 편차를 구한 다음에는 분산을 구해야 하는데요. 분산은 편차의 제곱의 평균이라고 했어요. 그런데 도수분포표에서는 편차 제곱에 도수를 구한 것들의 평균이에요. 편차의 제곱에 도수를 꼭 곱해줘야 해요.
일반적인 변량이었다면 각각 편차를 구해서 더했을 텐데, 도수분포표에서는 각각의 편차를 구할 수 없기때문에 대표인 계급값을 이용했던 거거든요. 그런데 같은 계급값을 갖는 변량이 도수의 개수만큼 있잖아요. 특정한 계급값을 대표로 갖는 도수의 개수만큼을 곱해줘야 해당 계급의 변량들의 값을 모두 더한 게 되는 거죠.
편차의 합은 0이라고 했는데, 위 도수분포표에서 편차의 합은 0이 아니에요. 대신 편차에 도수를 곱해서 더하면 0이 되는 겁니다.
각 계급의 (편차)2 × 도수를 구한 다음에 도수의 총합으로 나누면 그게 바로 분산입니다. 분산이 60이 나왔네요. - 마지막으로 표준편차는 분산에 제곱근을 씌운 거니까
가 되네요.
함께 보면 좋은 글
대푯값과 평균, 중앙값, 최빈값
산포도와 편차
분산과 표준편차
[중등수학/중1 수학] - 도수분포표, 변량, 계급, 계급값, 도수
[중등수학/중1 수학] - 도수분포표 만드는 법
[중등수학/중1 수학] - 도수분포표에서의 평균구하기
분산과 표준편차
산포도에 대해서 알아보고 있어요. 산포도에서 가장 많이 쓰이는 게 이번 글에서 다룰 분산과 표준편차에요.
한 번의 계산으로 구해지는 게 아니라 여러 단계를 거쳐서 구해야 하는 조금은 귀찮고 까다로울 수 있는 내용이에요. 반대로 단계별 순서만 기억하면 계산은 어렵지 않아서 쉽게 구할 수 있어요.
산포도와 편차에서 바로 이어지는 내용이니까 미리 읽어두세요. 분산과 표준편차의 뜻과 구하는 방법에 대해서 알아보죠.
분산
편차는 음수와 0, 양수가 섞여 있어요. 다 더하면 0이고, 평균도 0이 되지요. 따라서 편차의 평균으로는 산포도를 알 수 없어요.
새로운 뭔가가 필요해서 음수 없이 양수만 나오게 하려고 편차를 제곱하는 방법을 이용합니다. 이 편차 제곱의 평균을 이용해서 산포도를 구하게 된 거죠.
분산은 편차 제곱의 평균이에요. 제곱의 평균이니까 일단 편차를 전부 다 제곱해서 더한 다음 편차(변량)의 개수로 나누어야겠죠?
표준편차
분산을 구했더니 이게 제곱한 값들의 평균이라서 값이 너무 커질 때가 있어요. 제곱한 거니까 원래대로 돌려주려면 어떻게 해야하나요? 제곱근을 씌우면 되죠?
표준편차는 분산에 제곱근을 씌운 거예요. 제곱근을 씌웠으니까 양수인데요. 0이 될수도 있어요. 즉, 분산의 음이 아닌 제곱근을 말해요.
표준편차를 구하는 순서는 조금 복잡하네요.
표준편차 구하는 순서: 변량의 평균 → 편차 → 분산 → 표준편차
결국 표준편차를 구하려면 평균과 편차, 분산을 모두 구해야 해요.
19, 20, 21, 19, 26의 표준편차를 구하여라.
표준편차를 구하라고 했어요. 위해서 했던 것처럼 표준편차를 구하려면 평균 → 편차 → 분산 → 표준편차의 순서대로 구해야 해요. 순서대로 구해보죠. 표를 이용해서 구해볼까요?
합계 | 평균 | ||||||
---|---|---|---|---|---|---|---|
변량 | 19 | 20 | 21 | 19 | 26 | 105 | ①21 |
②편차 | -2 | -1 | 0 | -2 | 5 | 0 | 0 |
(편차)² | 4 | 1 | 0 | 4 | 25 | 34 | ③6.8 |
① 평균 = (19 + 20 + 21 + 19 + 26) ÷ 5 = 21이네요.
② (편차) = (변량) - (평균)으로 구할 수 있고요.
③ 분산은 (편차)²의 평균이니까 각각의 제곱을 구해서 더해야겠죠. 그다음 평균을 구했더니 6.8이 나왔어요.
이제 문제에서 구하려고 하는 표준편차를 구할 차례인데, 표준편차는 분산에 제곱근을 씌운 거에요. 따라서 이 되네요.
자료의 분산과 표준편차가 크면 클수록 그 자료는 평균을 중심으로 멀리 흩어져있다고 할 수 있죠. 분산과 표준편차는 산포도의 한 종류니까요. 단순히 분산과 표준편차를 구하는 것에 그치지 말고, 그 수치가 어떤 의미를 가졌는지도 알아야 해요.
함께 보면 좋은 글
대푯값과 평균, 중앙값, 최빈값
산포도와 편차
도수분포표에서의 분산과 표준편차
산포도와 편차
대푯값에 대해서 알아봤어요. 평균, 중앙값, 최빈값이 있었죠? 대푯값은 말 그대로 변량들의 특징을 대표적으로 나타낼 수 있는 값이에요.
그런데 이번에는 자료의 대표적인 특징이 아니라 자료가 어떻게 분포되어 있는지 알고 싶어요. 대푯값으로는 알 수가 없거든요.
그래서 자료의 분포를 쉽게 알아볼 수 있는 값을 구해야 하는데 그게 바로 산포도입니다.
산포도
산포도는 자료가 흩어져 있는 정도를 하나의 수로 나타낸 값이에요. 산포는 분포랑 비슷한 뜻이에요.
산포도도 대푯값처럼 딱 하나만 있는 게 아니라 여러 가지 종류가 있어요. 그중에서도 분산과 표준편차가 가장 많이 쓰이는데, 이것에 대해서는 다음 글 분산과 표준편차에서 자세히 설명할게요.
산포도는 평균에 얼마나 가까이 있느냐, 평균에서 얼마나 멀리 있느냐를 통해서 자료가 흩어진 정도를 알아보는 방법이에요. 따라서 평균을 제일 먼저 구해야 해요. 자료의 변량이 평균에 가까이 있으면 "산포도가 작다"고 하고, 평균에서 멀리 떨어져 있으면 "산포도가 크다"고 해요.
편차
산포도는 평균에서 얼마나 떨어져 있느냐가 중요하잖아요. 평균에서 얼마나 떨어져 있느냐를 값으로 나타낸 게 편차이에요. 편차는 아래 공식으로 구해요.
변량이 평균보다 크면 편차 > 0이고, 변량이 평균보다 작으면 편차 < 0이 돼요.
편차의 부호와 상관없이 편차의 절댓값이 작을수록 평균에 가까이 있고, 절댓값이 클수록 평균에서 멀리 떨어져 있는 거죠.
또 하나 기억해야 할 게 편차의 합 = 0이에요.
90, x, 85, 95, 100의 다섯 숫자의 평균이 90일 때 x와 그 편차를 구하여라.
평균 90은 다섯 수를 모두 더해서 5로 나눈 값이죠? 그 과정을 거꾸로 하면 x를 구할 수 있어요.
(90 + x + 85 + 95 + 100) ÷ 5 = 90
90 + x + 85 + 95 + 100 = 450
x = 80
x = 80이에요. 편차 = 변량 - 평균이므로 x의 편차는 80 - 90 = -10이 되네요.
함께 보면 좋은 글
대푯값과 평균, 중앙값, 최빈값
분산과 표준편차
도수분포표에서의 분산과 표준편차