산포도에 대해서 알아보고 있어요. 산포도에서 가장 많이 쓰이는 게 이번 글에서 다룰 분산과 표준편차에요.
한 번의 계산으로 구해지는 게 아니라 여러 단계를 거쳐서 구해야 하는 조금은 귀찮고 까다로울 수 있는 내용이에요. 반대로 단계별 순서만 기억하면 계산은 어렵지 않아서 쉽게 구할 수 있어요.
산포도와 편차에서 바로 이어지는 내용이니까 미리 읽어두세요. 분산과 표준편차의 뜻과 구하는 방법에 대해서 알아보죠.
분산
편차는 음수와 0, 양수가 섞여 있어요. 다 더하면 0이고, 평균도 0이 되지요. 따라서 편차의 평균으로는 산포도를 알 수 없어요.
새로운 뭔가가 필요해서 음수 없이 양수만 나오게 하려고 편차를 제곱하는 방법을 이용합니다. 이 편차 제곱의 평균을 이용해서 산포도를 구하게 된 거죠.
분산은 편차 제곱의 평균이에요. 제곱의 평균이니까 일단 편차를 전부 다 제곱해서 더한 다음 편차(변량)의 개수로 나누어야겠죠?
표준편차
분산을 구했더니 이게 제곱한 값들의 평균이라서 값이 너무 커질 때가 있어요. 제곱한 거니까 원래대로 돌려주려면 어떻게 해야하나요? 제곱근을 씌우면 되죠?
표준편차는 분산에 제곱근을 씌운 거예요. 제곱근을 씌웠으니까 양수인데요. 0이 될수도 있어요. 즉, 분산의 음이 아닌 제곱근을 말해요.
표준편차를 구하는 순서는 조금 복잡하네요.
표준편차 구하는 순서: 변량의 평균 → 편차 → 분산 → 표준편차
결국 표준편차를 구하려면 평균과 편차, 분산을 모두 구해야 해요.
19, 20, 21, 19, 26의 표준편차를 구하여라.
표준편차를 구하라고 했어요. 위해서 했던 것처럼 표준편차를 구하려면 평균 → 편차 → 분산 → 표준편차의 순서대로 구해야 해요. 순서대로 구해보죠. 표를 이용해서 구해볼까요?
합계 | 평균 | ||||||
---|---|---|---|---|---|---|---|
변량 | 19 | 20 | 21 | 19 | 26 | 105 | ①21 |
②편차 | -2 | -1 | 0 | -2 | 5 | 0 | 0 |
(편차)² | 4 | 1 | 0 | 4 | 25 | 34 | ③6.8 |
① 평균 = (19 + 20 + 21 + 19 + 26) ÷ 5 = 21이네요.
② (편차) = (변량) - (평균)으로 구할 수 있고요.
③ 분산은 (편차)²의 평균이니까 각각의 제곱을 구해서 더해야겠죠. 그다음 평균을 구했더니 6.8이 나왔어요.
이제 문제에서 구하려고 하는 표준편차를 구할 차례인데, 표준편차는 분산에 제곱근을 씌운 거에요. 따라서 이 되네요.
자료의 분산과 표준편차가 크면 클수록 그 자료는 평균을 중심으로 멀리 흩어져있다고 할 수 있죠. 분산과 표준편차는 산포도의 한 종류니까요. 단순히 분산과 표준편차를 구하는 것에 그치지 말고, 그 수치가 어떤 의미를 가졌는지도 알아야 해요.
함께 보면 좋은 글
대푯값과 평균, 중앙값, 최빈값
산포도와 편차
도수분포표에서의 분산과 표준편차