전체 글 (28) 썸네일형 리스트형 (통계 용어) 자유도 (Degree of Freedom)란? 통계를 하면서 정말 많이 보는 것중 하나가 자유도입니다. 자유도... 많이 접하지만 막상 설명하려면 하기 어려운 용어인 것 같습니다. 이 자유도에 대해서 한번 이야기 해보겠습니다 : ) 자유도의 의미 1. (Wikipedia) 통계적 추정을 할 때 표본 자료 중 모집단(x)에 대한 정보를 주는 독립적인 자료의 수. 2. (나무위키) "변인의 수 빼기 제약" 3. 자유로운 수 자유도의 의미는 위와 같이 여러 방법으로 이야기 할 수 있으며, 구글 검색만 해도 정말 많은 블로그에서 소개하고 있습니다. 제가 이해하기 편한 자유도의 의미는 "확률변수로부터 자유롭게 선택될 수 있는 자료의 수" 입니다. 흔히 자유도를 이야기할 때 자주 사용하는 ˉX와 S2으로 이야기 해보겠습니다. 1. 표본평균.. VIF > 10의 의미는 무엇일까? VIF란, Variance Inflation Factor의 약자로서, 분산 팽창 인수라고 합니다. 이 값은 다중회귀분석에서 독립변수가 다중 공산성(Multicollnearity)의 문제를 갖고 있는지 판단하는 기준이며, 주로 10보다 크면 그 독립변수는 다중공산성이 있다고 말합니다. 그렇다면 VIF는 어떻게 계산되고, 10보다 크다는 것은 무엇을 의미할까요? 먼저 VIF는 다음과 같은 식으로 계산됩니다. VIFi=11−ri ri = i 번째 변수를 제외한 회귀식의 R2값 위 식을 바탕으로 VIFi > 10이 의미하는 바를 보면 다음과 같습니다. ri > 0.9 라는 것의 의미는 i 번째 독립변수가 빠져도 나머지 변수들이 반응 변수(y)를 90.. (통계 용어) 유의수준 and 유의확률 제 1종 오류(α) 귀무가설과 대립가설 검정통계량 설명에 앞서 위 개념에 대해 잘 모르신다면, 아래 글을 읽고 오시면 이해하시는데 도움이 될 것입니다 :) → (통계 용어) 제 1종 오류, 제 2종 오류, 검정력 (통계 용어) 검정력 (Power) 유의수준(α) 제 1종 오류를 범할 최대 허용치 → 이 값은 사전에 "미리" 오류의 허용 범위를 지정하는 것으로서, "관측치와 무관한 값"입니다. 위의 그림에서 "검정통계량값 2"를 갖는 경우 귀무가설(H0)이 기각된다고 할 수 있습니다. ※ 유의수준 95% vs 99% 95%의 경우가 99% 보다 H1을 지지하는 검정통계량 값을 많이 허용합니다. 99%가 95%보다 H0을 더 옹호합니다. 유의확률 (p-valu.. (통계 용어) 확률 변수, 확률 분포 Etc 확률 실험 (Probability Experiment) 실험의 결과가 여러 가지의 경우러 나타나는 실험 표본 공간 (S, Sample Space) 확률 실험의 결과로 나타날 수 있는 모든 실현치들(outcomes)의 집합 확률 변수 (R.V, Random Variable) 표본공간의 각 원소에 실수값을 대응시켜주는 (일종의) "함수" 확률 분포 (Probability distribution) x 영역에서의 x값들이 취활 확률 확률 표본(Random Sample) 확률변수로 값이 주어지기전의 가상의 표본, 대문자 X로 사용 예를 들어보자면, 확률 실험 : 동전 2개를 던지는 실험 (실험의 결과가 H : 앞면, T : 뒷면 으로 여러개로 나타납니다.) 표본 공간 : HH, HT, TH, TT 확률.. (통계 용어) 표준 편차 vs 표준오차 표준편차 와 표준오차 통계를 공부하는 사람이라면, 표준편차에 대해 많이 들어봤을 것입니다. 그렇다면 표준오차는 무엇일까요? 표준편차랑 같은 것일까요? 그 차이점에 대해 이야기해보겠습니다. 표준편차 (SD, Standard Deviation) 자료가 평균으로부터 얼마나 퍼져있는지 나타내는 지표 아래의 그림에서 σ에 해당합니다. 표준오차 (SEM, Standard Error of the Mean) 표본의 평균이 얼마나 모평균에 가까운지 나타내는 지표 여기서, SEM은 두 가지 특징을 갖습니다. 모집단의 변동과 추출된 표본의 개수에 따라 좌우된다. 그러나 실제로는 하나의 표본만 추출하므로, 이 표본의 표준편차(SD)와 표본수를 이용하여 표준오차(SEM)를 추정. 표준편차(SD)와 .. (통계 용어) 검정력 (Power) 검정력이란, 대립가설(H1)이 참일 때, 귀무가설(H0)을 기각할 확률로서, power 또는 1−β로 나타낸다. (조금 더 자세한 내용은 이곳을 참고해주세요) 검정력 함수 귀무가설(H0)을 기각할 확률을 모수값의 함수로 나타낸 것을 의미합니다. 검정 통계량 가설의 옳고 그름을 판단하는데 기준이 되는 통계량 입니다. 모수에 대한 추정량의 함수로, 검정통계량의 관측값은 데이터가 대립가설(H1)을 지지하는 정도를 의미합니다. (그러나 강약은 알 수 없습니다.) 검정통계량의 분포 귀무가설(H0)이 사실이라는 전제하에 구하게 됩니다. H0:μ=0 vs H1:μ=3 일 때, $\frac {\bar {X}-\mu}{s/\sqrt.. (통계 용어) 제 1종 오류, 제 2종 오류, 검정력 대립 가설(H1) : 주장하고자 하는 가설 귀무 가설(H0) : 그것에 반하는 가설 제 1종 오류 - α or α(θ) 귀무가설(H0)이 참일 때, 귀무가설(H0)를 기각하는 오류 입니다. 제 2종 오류 - β or β(θ) 대립가설(H1)이 참일 때, 귀무가설(H0)를 기각하는 채택하는 오류 입니다. 검정력 - power or 1−β(θ) 대립가설(H1)이 참일 때, 귀무가설(H0)를 기각하는 오류 입니다. (검정력, 검정 통계량에 관한 내용은 따로 정리하였습니다.) ※ 위 세 값을 식으로 표현하면 다음과 같습니다. 제 1종 오류 : P(H0기각|H0참) 제 .. (통계 용어) 통계량, 추정량, 추정치 통계량 : 표본에 따라 변동하는 확률변수 (→ 표본을 뽑을 때마다 값이 변합니다.) Ex) 표본 평균, 표본 분산 etc 추정량 : 미지의 모수(θ)의 추정에 사용되는 통계량 (→ 통계량의 일부입니다.) Ex) ˉX=∑Xin 추정치 : 확률 표본의 특정한 관측값에 대한 추정량의 관측값 (→ 즉, 추정량에 실제 관측값을 대입하여 나온 값을 의미합니다.) Ex) ˉx=∑xin 이전 1 2 3 4 다음 목록 더보기