Processing math: 100%
본문 바로가기

Statistics

(통계 용어) 자유도 (Degree of Freedom)란?

 

통계를 하면서 정말 많이 보는 것중 하나가 자유도입니다.

 

자유도... 많이 접하지만 막상 설명하려면 하기 어려운 용어인 것 같습니다. 

이 자유도에 대해서 한번 이야기 해보겠습니다 : )

 

 

자유도의 의미

 

1. (Wikipedia) 통계적 추정을 할 때 표본 자료 중 모집단(x)에 대한 정보를 주는 독립적인 자료의 수.

2. (나무위키) "변인의 수 빼기 제약" 

3. 자유로운 수

 

자유도의 의미는 위와 같이 여러 방법으로 이야기 할 수 있으며, 구글 검색만 해도 정말 많은 블로그에서 소개하고 있습니다. 

 

제가 이해하기 편한  자유도의 의미는 

 

"확률변수로부터 자유롭게 선택될 수 있는 자료의 수"

 

입니다.

 


흔히 자유도를 이야기할 때 자주 사용하는 ˉXS2으로 이야기 해보겠습니다.

 

1. 표본평균

 

ˉX=1nni=1xi

      =1n(x1+x2++xn)

 

여기서  자유도로 n을 사용한 이유는 계산에 사용되는 자료 n 모두 측정된 자료로서 모두 자유롭기 때문입니다.

 

즉, 사용된 자료를 제한하는 어떠한 제약도 없는 상태이므로, n개 모두 자유롭기 때문에 자유도가 n개가 되는 것입니다.

 

그렇다면 표본표준편차는 어떨까요?

 


2. 표준편차

 

S2=1n1ni=1(xiˉx)2

 

이 표준편차의 식에서는 사용되는 n개의 자료에 제약을 주는 한 가지가 있습니다.

바로 "확률변수 ˉx"입니다.

 

n개의 자료에서 n1개는 자유로운 값입니다.

그러나 1개의 자료는 위에서 구한 ˉx의 값을 맞춰주기 위해자유롭지 못하고 제약을 받는 값이되게 됩니다.

따라서 n의 자료 중 1개를 뺀 n1이 이 식에서 자유도가 되는 것입니다.

 


 

3.  다른 예시

 

간단한 예시를 또 들어보자면, 

 

X1,X2,X3,X4,X5의 값이 무엇인지는 모르지만,  X1+X2+X3+X4+X5 = 100 이라고 합시다.

 

그렇다면, 이 중 4개는 아무렇게나 뽑아도 되지만, 마지막 하나는 합이 100이 되도록 맞춰 뽑아야 하기 때문에

 

5개의 자료 값 중 1개는 자유롭지 못하게 되는 것입니다.

 

즉, 이 경우 자유도는 4(5-1)개가 되는 것입니다 : )

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형