표본분표에 대해 이해가 가지 않는 부분이 있습니다
모집단이 있는데, 표본을 뽑아서 분산을 구할때는 n 으로 나누는게 아니라 n-1로 나눠야 한다고 배우고 이해했습니다.
그런데 자료를 공부하던 중 이미지와 같이 표본분산 V(X) = 시그마(제곱) / n 으로 적혀있더라고요.
저게 n 말고 n-1이 되어야 하는거 아닌가요?
이게
안녕하세요. 이태영 경제전문가입니다.
보통 우리가 표본분산을 구할 때 n-1으로 나누는 이유는 모분산을 더 정확하게 추정하기 위해서입니다.
*표본은 모집단의 부분: 표본은 모집단의 모든 정보를 담고 있지 않기 때문에, 표본 평균은 모집단 평균과 약간의 차이가 있을 수 있습니다.
**자유도 개념: 이러한 차이 때문에, 표본 분산을 단순히 n으로 나누면 모분산을 과소 추정하는 경향이 있습니다. 이를 보정하기 위해 자유도라는 개념을 도입하고, 분모를 n-1로 수정합니다.
***불편 추정량: n-1로 나눈 표본 분산은 모분산의 불편 추정량이 됩니다. 즉, 표본의 크기가 커질수록 모분산에 가까워지는 값을 얻을 수 있습니다.
자료에서 표본 분산을 n으로 나눈 식이 등장한 이유는 크게 두 가지로 생각해 볼 수 있습니다.
*단순화: 수식을 간단하게 표현하기 위해 n으로 나눈 식을 사용했을 수 있습니다. 특히, 이론적인 설명이나 개념을 소개할 때 자주 사용되는 방법입니다.
**특수한 경우: 특정한 조건이나 가정 하에서는 n으로 나눠도 큰 문제가 없는 경우도 있습니다. 예를 들어, 표본의 크기가 매우 크거나 모집단의 분산이 이미 알려져 있는 경우에는 n으로 나눠도 무방할 수 있습니다.
표본 분산을 구할 때 일반적으로 n-1로 나누는 것이 맞습니다. 하지만 자료에 따라 n으로 나눈 식이 등장할 수 있으며, 이는 상황에 따른 간략화나 특수한 경우에 해당될 수 있습니다.