본문 바로가기
Mathematics/통계학

[통계학] 4.5-(1) Example: 랜덤 변수 덧셈의 분산 Variance of the Addition of Random Variables

by 피그티 2021. 8. 9.

2.3 분산, 모멘트 생성 함수 Variance, Moment Generating Functions에서 다음과 같은 분산의 성질에 대하여 살펴보았다.

Var(aX+b)=a2Var(X)

이번 페이지에서는 위 식의 더 일반적인 형태로 다음의 정리를 살펴본다.

 

THEOREM

Random variable X, Y, 상수 a, b 에 대하여,
Var(aX+bY)=a2Var(X)+b2Var(Y)+2abCov(X,Y)
만약 XY 가 서로 독립이면, 다음이 성립한다.
Var(aX+bY)=a2Var(X)+b2Var(Y)

 

(증명)

먼저 random variable aX+bY 의 expected value는

E[aX+bY]=aE[X]+bE[Y]=aμX+bμY

이다. 이제 variance의 정의로부터

Var(aX+bY)=E[{(aX+bY)(aμX+bμY)}2]=E[{a(XμX)b(YμY)}2]=E[a2(XμX)2+b2(YμY)2+2ab(XμX)(YμY)]=a2E[(Xμx)2]+b2E[(YμY)2]+2abE[(XμX)(YμY)]=a2Var(X)+b2Var(Y)+2abCov(X,Y)

또한 XY 가 독립인 경우에는 Cov(X,Y)=0 이므로 식이 성립한다.

(증명 끝)

 

(???)에 따르면, XY 의 covariance가 양의 값을 가지는 경우에는 X+Y 는 각 random variable의 variance의 합보다 더 큰 variance를 가지게 된다. 4.5 공분산, 상관계수 Covariance, Correlation에서 covariance가 양수 일때는 선형 관계 Y=aX+b 에서 a>0 인 관계를 표현하므로, XX 의 평균보다 큰 값을 가지면, Y 도 이 관계에 의해 Y 의 평균보다 큰 값을 가지게 되어 X+YX+Y 의 평균보다 보다 더 큰 값을 가지게 된다. variance는 이 차이의 제곱이 반영되는 것이므로 이러한 현상이 나타난다.

반대로 covariance가 음의 값을 가지는 경우에는 X+Y 의 variance는 X 의 variance, Y 의 variance의 합보다 더 작은 값을 가지게 된다.

 

위 정리의 더 일반적인 형태는 다음과 같다. (증명은 완전 제곱식의 전개가 더 길어지는 것밖에 차이가 없으므로 생략한다.)

 

THEOREM

Random variable X1, X2, ..., Xn, 상수 a1, a2, ..., an 에 대하여,
Var(i=1naiXi)=i=1nai2Var(Xi)+21i<jnaiajCov(Xi,Xj)