통계를 하면서 정말 많이 보는 것중 하나가 자유도입니다.
자유도... 많이 접하지만 막상 설명하려면 하기 어려운 용어인 것 같습니다.
이 자유도에 대해서 한번 이야기 해보겠습니다 : )
자유도의 의미
1. (Wikipedia) 통계적 추정을 할 때 표본 자료 중 모집단($x$)에 대한 정보를 주는 독립적인 자료의 수.
2. (나무위키) "변인의 수 빼기 제약"
3. 자유로운 수
자유도의 의미는 위와 같이 여러 방법으로 이야기 할 수 있으며, 구글 검색만 해도 정말 많은 블로그에서 소개하고 있습니다.
제가 이해하기 편한 자유도의 의미는
"확률변수로부터 자유롭게 선택될 수 있는 자료의 수"
입니다.
흔히 자유도를 이야기할 때 자주 사용하는 $\bar{X}$와 $S^2$으로 이야기 해보겠습니다.
1. 표본평균
$\bar{X} = {1 \over n} \sum_{i=1}^{n} x_i$
$= {1 \over n}(x_1 + x_2 + \cdots + x_n)$
여기서 자유도로 $n$을 사용한 이유는 계산에 사용되는 자료 $n$ 모두 측정된 자료로서 모두 자유롭기 때문입니다.
즉, 사용된 자료를 제한하는 어떠한 제약도 없는 상태이므로, $n$개 모두 자유롭기 때문에 자유도가 $n$개가 되는 것입니다.
그렇다면 표본표준편차는 어떨까요?
2. 표준편차
$S^2 = {1 \over n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2$
이 표준편차의 식에서는 사용되는 $n$개의 자료에 제약을 주는 한 가지가 있습니다.
바로 "확률변수 $\bar{x}$"입니다.
$n$개의 자료에서 $n-1$개는 자유로운 값입니다.
그러나 1개의 자료는 위에서 구한 $\bar{x}$의 값을 맞춰주기 위해서 자유롭지 못하고 제약을 받는 값이되게 됩니다.
따라서 $n$의 자료 중 1개를 뺀 $n-1$이 이 식에서 자유도가 되는 것입니다.
3. 다른 예시
간단한 예시를 또 들어보자면,
$X_1, X_2, X_3, X_4 , X_5$의 값이 무엇인지는 모르지만, $X_1 + X_2 + X_3 + X_4 + X_5$ = 100 이라고 합시다.
그렇다면, 이 중 4개는 아무렇게나 뽑아도 되지만, 마지막 하나는 합이 100이 되도록 맞춰 뽑아야 하기 때문에
5개의 자료 값 중 1개는 자유롭지 못하게 되는 것입니다.
즉, 이 경우 자유도는 4(5-1)개가 되는 것입니다 : )
'Statistics' 카테고리의 다른 글
(수리 통계) Gamma distribution (감마 분포) (0) | 2021.12.20 |
---|---|
(통계 용어) 유의수준 and 유의확률 (0) | 2021.03.22 |
(통계 용어) 확률 변수, 확률 분포 Etc (0) | 2021.03.22 |
(통계 용어) 표준 편차 vs 표준오차 (0) | 2021.03.22 |
(통계 용어) 검정력 (Power) (0) | 2021.03.22 |