본문 바로가기
Mathematics/통계학

[통계학] 5.2-(3) F 분포 F-distribution

by 피그티 2021. 8. 17.

많은 영역에서, 어떤 특징을 설명해주는 값이 A 집단과 B 집단에서 어떻게 되는지 비교하는 경우가 발생한다. 예를 들어 건물 전면에서 나오는 광고의 주 배경이 빨강일 때와 파랑일 때 광고 효과에 대해서 비교하고 싶을 수 있다. 이렇게 여러 집단 간의 비교 할 때, 분산이 결과 해석에 있어 중요한 역할을 한다.[각주:1] 이번 페이지에서는 이러한 분산에 대해서 중요한 위치를 차지하고 있는 F 분포에 대해서 살펴본다.

 

#Snedecor's F Distribution

5.2-(1) Example: 정규 분포에서의 샘플 평균, 샘플 분산 Sample mean and Sample variance of Random sample from Normal Distribution에서 N(μ,σ2) 에서 샘플링한 경우, sample mean과 sample variance는 각각

XN(μ,σ2n),(n1)S2σ2χn12

임을 살펴보았다.

 

이제 N(μX,σX2) 에서 X1, ..., Xn 이렇게 n 개를 샘플링하고, N(μY,σY2) 에서 Y1, ..., Ym 이렇게 m 개를 샘플링했다고 하자. 그러면

(n1)SX2σX2χn12,(m1)SY2σY2χm12

이므로, 두 모분산의 비율 σX2σY2 의 값을

SX2/σX2SY2/σY2χn12/(n1)χm12/(m1)

의 분포를 이용해 추정, 분석할 수 있다. 이 때, 이 분포를 F-distribution이라고 한다.

 

DEFINITION          F-distribution

Random variable X 가 다음 pdf를 따르는 경우, X 가 degree of freedom d1, d2 인 Snedecor's F distribution을 따른다고 부른다. Snedecor's F distribution 대신 줄여서 간단히 F-distribution이라고도 부른다.
f(x)=(d1x)d1d2d2(d1x+d2)d1+d2xB(d12,d22)=1B(d12,d22)(d1d2)d12xd121(1+d1d2x)d1+d22
X 가 degree of freedom d1, d2 인 F-distribution을 따른다는 것을 기호로 다음과 같이 표현한다.
XF(d1,d2)

 

F-distribution의 pdf는 다음과 같은 그래프를 가진다.

 

F-distribution pdf

IkamusumeFan, CC BY-SA 4.0, via Wikimedia Commons

 

#Basic Properties

1. Mean of F-distribution

E[X]=d2d22 if d2>2

 

(증명)

pdf로부터 직접 계산하기보다는 아래에서 chi-squared distribution과의 관계를 이용하여 구하자. Random variable Uχd12, Vχd22 가 서로 independent이면,

X=U/d1V/d2F(d1,d2)

이므로, independence의 성질[각주:2]을 이용하여

E[X]=1d1E[U]×d2E[1V]

가 된다. 먼저 E[U] 는 chi-squared distribution[각주:3]의 mean이므로

E[U]=d1

그리고 E[1V] 를 구하면,

E[1V]=01vfV(v) dv=12d2/2Γ(d22)0vd222ev2 dv

이 때 마지막 적분은 chi-squared distribution χd222 의 적분과 같으므로

2d221Γ(d221)

와 같다. 따라서

E[1V]=2d2/21Γ(d221)2d2/2Γ(d22)=1d22

단, 위 식은 d2>2 일 때만 성립한다. 그러므로 

E[X]=d2d22

(증명 끝)

 

2. Variance of F-distribution

Var(X)=2d22(d1+d22)d1(d22)2(d24) if d2>4

 

(증명)

1번과 같은 방식으로

E[X2]=E[(U/d1V/d2)2]

다시, UV 는 서로 independent하므로

E[X2]=1d12E[U2]×d22E[1V2]

그리고

E[U2]=d1(d1+2)E[1V2]=01v2fV(v) dv=12d2/2Γ(d22)0vd223ed22 dv

이 때, 마지막 적분은 χd242 의 적분과 같으므로

2d222Γ(d222)

가 된다. 따라서

E[1V2]=1(d22)(d24)

단, 이 식은 d2>4 일 때만 유효하다. 이를 이용하면,

Var(X)=E[X2](E[X])2=2d22(d1+d22)d1(d22)2(d24)

(증명 끝)

 

 

#Related Distributions

1. Distribution of Sample Variances from Normal Distributions

이제 처음에 논의한 내용을 살펴보자.

 

THEOREM

Random variable U1 이 degree of freedom d1 인 chi-squared distribution[각주:4]이고, U2 가 degree of freedom d2 인 chi_squared distribution이라고 하자. 또한, U1U2 는 서로 independent하다고 하자. 그러면
X=U1/d1U2/d2F(d1,d2)

 

(증명)

U1U2 는 서로 독립이므로 joint pdf는

fU1,U2(u1,u2)=12d1/2Γ(d12)12d2/2Γ(d22)u1d121u2d221eu12eu22

이제, tranform X=U1/d1U2/d2, Y=U2 를 적용하면, Inverse Jacobian determinant는 d1d2y 이므로

fX(x)=0fX,Y(x,y) dy=0fU,V(d1d2xy,y) dy=12d1+d22Γ(d12,d22)0(d1d2xy)d121yd221e12d1d2xyey2d1d2y dy=12d1+d221Γ(d12)Γ(d22)(d1d2)d12xd1210yd1+d221e(d12d2x+12)y dy

이 때, 적분 부분은 gamma distribution에서 적분과 같으므로

(1+d1d2x)d1+d222d1+d22Γ(d1+d22)

가 되어

fX(x)=1B(d12,d22)(d1d2)d12xd121(1+d1d2x)d1+d22

즉, F(d1,d2) 의 pdf를 얻는다.

(증명 끝)

 

2. Beta Distribution

THEOREM

Random variable XF(d1,d2) 일 때,[각주:5]
(d1/d2)X1+(d1/d2)XBeta(d12,d22)

 

(증명)

x>0 인 영역에서 transform W=(d1/d2)X1+(d1/d2)X 는 1대1 대응이므로, transform된 pdf를 구하면,

fW(w)=fx(d2d1w1w)×d2d11(1w)2=1B(d12,d22)(d1d2)d12(d2d1w1w)d121(1+w1w)d1+d22d2d11(1w)2=1B(d12,d22)(w1w)d121(11w)d1+d221(1w)2=1B(d12,d22)wd121(1w)d221

즉, Beta(d12,d22) 의 pdf를 얻는다.

(증명 끝)

 

3. F-distribution

THEOREM

Random variable XF(d1,d2) 일 때,
1XF(d2,d1)

 

(증명)

Transform Y=1X 는 1대1 대응이므로, transform된 pdf를 구하면,

fY(y)=fX(1y)=1B(d12,d22)(d1d2)d12y1d12(1+d1d21y)d1+d22×1y2=1B(d12,d22)(d1d2)d12yd121(d2y+d1)d1+d22(d2y)d1+d22=1B(d22,d12)d1d12d2d22yd221(d2y+d1)d1+d22=1B(d22,d12)d2d22yd221d1d12d1d1+d22(1+d2d1)d2+d12=1B(d22,d12)(d2d1)d22yd221(1+d2d1)d2+d12

즉, F(d2,d1) 의 pdf를 얻는다.

(증명 끝)

 

4. Student's t-distribution

THEOREM[각주:6]

Random variable Xtn 일 때,
X2F(1,n)X2F(n,1)

 

 

  1. 자세한 내용은 ...analysis of variance,intro... 참고 [본문으로]
  2. 4.3 서로 독립인 두 개의 랜덤 변수 Bivariate Independent Random Variables 참고 [본문으로]
  3. ...chi-squared distribution... 참고 [본문으로]
  4. chi-squared distribution에 대해서는 ...chi-squared... 참고 [본문으로]
  5. beta distribution에 대해서는 ...beta distribution... 참고 [본문으로]
  6. 증명은 5.2-(2) 스튜던트 t 분포 Student's t-distribution참고 [본문으로]