본문 바로가기

Statistics

(통계 용어) 자유도 (Degree of Freedom)란?

 

통계를 하면서 정말 많이 보는 것중 하나가 자유도입니다.

 

자유도... 많이 접하지만 막상 설명하려면 하기 어려운 용어인 것 같습니다. 

이 자유도에 대해서 한번 이야기 해보겠습니다 : )

 

 

자유도의 의미

 

1. (Wikipedia) 통계적 추정을 할 때 표본 자료 중 모집단($x$)에 대한 정보를 주는 독립적인 자료의 수.

2. (나무위키) "변인의 수 빼기 제약" 

3. 자유로운 수

 

자유도의 의미는 위와 같이 여러 방법으로 이야기 할 수 있으며, 구글 검색만 해도 정말 많은 블로그에서 소개하고 있습니다. 

 

제가 이해하기 편한  자유도의 의미는 

 

"확률변수로부터 자유롭게 선택될 수 있는 자료의 수"

 

입니다.

 


흔히 자유도를 이야기할 때 자주 사용하는 $\bar{X}$와 $S^2$으로 이야기 해보겠습니다.

 

1. 표본평균

 

$\bar{X}  =  {1 \over n} \sum_{i=1}^{n} x_i$

      $= {1 \over n}(x_1 + x_2 + \cdots + x_n)$

 

여기서  자유도로 $n$을 사용한 이유는 계산에 사용되는 자료 $n$ 모두 측정된 자료로서 모두 자유롭기 때문입니다.

 

즉, 사용된 자료를 제한하는 어떠한 제약도 없는 상태이므로, $n$개 모두 자유롭기 때문에 자유도가 $n$개가 되는 것입니다.

 

그렇다면 표본표준편차는 어떨까요?

 


2. 표준편차

 

$S^2  = {1 \over n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2$

 

이 표준편차의 식에서는 사용되는 $n$개의 자료에 제약을 주는 한 가지가 있습니다.

바로 "확률변수 $\bar{x}$"입니다.

 

$n$개의 자료에서 $n-1$개는 자유로운 값입니다.

그러나 1개의 자료는 위에서 구한 $\bar{x}$의 값을 맞춰주기 위해자유롭지 못하고 제약을 받는 값이되게 됩니다.

따라서 $n$의 자료 중 1개를 뺀 $n-1$이 이 식에서 자유도가 되는 것입니다.

 


 

3.  다른 예시

 

간단한 예시를 또 들어보자면, 

 

$X_1, X_2, X_3, X_4 , X_5$의 값이 무엇인지는 모르지만,  $X_1 + X_2 + X_3 + X_4 + X_5$ = 100 이라고 합시다.

 

그렇다면, 이 중 4개는 아무렇게나 뽑아도 되지만, 마지막 하나는 합이 100이 되도록 맞춰 뽑아야 하기 때문에

 

5개의 자료 값 중 1개는 자유롭지 못하게 되는 것입니다.

 

즉, 이 경우 자유도는 4(5-1)개가 되는 것입니다 : )

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형