본문 바로가기
Mathematics/통계학

[통계학] 4.3-(1) 서로 독립인 두 개의 정규 분포의 덧셈

by 피그티 2021. 2. 27.

서로 독립인 랜덤 변수 \(X\) 와 \(Y\) 가 각각 정규 분포를 따른다고 하자. 새로운 랜덤 변수 \(Z=X+Y\) 를 정의했을 때 \(Z\) 는 어떤 분포를 따르게 될까?

 

예를 들어 평균적으로 전류 2A가 흐르는 전자기기 A와 전류 3A가 흐르는 전자기기 B를 하나의 멀티탭에 연결하면, 멀티탭에 평균적으로 흐르는 전류는 5A로 예측할 수 있다. 하지만 더 구체적으로, 전류가 4.9A~5.0A 사이에 있을 확률은? 7A 이상으로 전류가 흐를 확률은? 이런 질문에 대답하기 위해서는 총 전류의 확률 분포, 즉, [A기기의 전류 + B기기의 전류]의 확률 분포에 대하여 이야기 할 수 있어야 한다.

 

이번 페이지에서는 독립적인 2개의 정규 분포를 따르는 랜덤 변수의 덧셈으로 정의되는 랜덤 변수의 확률 분포에 대하여 살펴본다.

COLLORARY

서로 Independent한 랜덤 변수 \(X\) 와 \(Y\) 의 mgf를 각각 \(M_X(t)\), \(M_Y(t)\) 라고 하자. 그러면 새로운 랜덤 변수 \(Z=X+Y\) 의 mgf는 다음과 같이 얻을 수 있다.
\[ M_Z(t) = M_X(t)M_Y(t) \]

 

랜덤 변수의 mgf의 정의 및 mgf와 pdf의 1대1 대응 관계에 대해서는 2.3 분산, 모멘트 생성 함수 Variance, Moment Generating Functions를 참고할 것.

 

(증명)

mgf의 정의로 부터

\[ M_Z(t) = E[e^{tZ}] = E[e^{t(X+Y)}] = E[e^{tX}e^{tY}] \]

이 때, \(X\) 와 \(Y\) 가 independent이므로

\[ E[e^{tX}e^{tY}] = E[e^{tX}]E[e^{tY}] = M_X(t) M_Y(t) \]

(End of proof)

 

Example

만약 \(X \sim \mathcal{N}(\mu,\sigma^2) \), \(Y \sim \mathcal{N}(\nu, \tau^2)\) 가 서로 independent라고 가정하자. 각각의 mgf는 3.7 정규 분포 Normal Distribution에서 계산한 것처럼 아래 식과 같다.

\[ M_X(t) = e^{\mu t + \frac{\sigma^2 t^2}{2}} \]

\[ M_Y(t) = e^{\nu t + \frac{\tau^2 t^2}{2}} \]

따라서 새로운 랜덤 변수 \(Z=X+Y\) 의 mgf는 위의 따름정리에 의해

\[ M_Z(t) = M_X(t)M_Y(t) = e^{(\mu+\nu)t + \frac{(\sigma^2 + \tau^2) t^2}{2}} \]

가 된다.

 

이 mgf는 \(\mathcal{N}(\mu+\nu, \sigma^2+\tau^2)\) 의 mgf와 동일하므로, \(Z\) 는 평균이 \(\mu +\nu\), 분산이 \(\sigma^2 + \tau^2\) 인 정규 분포를 따른다는 결론을 얻을 수 있다.

 

맨 처음 예제의 답을 하자면, 만약 전자기기 A의 전류 분포가 평균 2A, 오차(즉, 표준편차) 0.5A인 정규 분포를 따르고, 전자기기 B의 전류 분포가 평균 3A, 오차 0.2A인 정규 분포를 따른다면, [A의 전류 + B의 전류] 분포는 평균이 5A, 분산이 0.29(표준 편차 0.539A) 인 정규 분포를 따르게 된다.

\[ f_Z(z) = \frac{1}{\sqrt{2\pi \times 0.29}} \exp{ \left( -\frac{(z-5)^2}{2\times0.29} \right) } \]

따라서, 멀티탭에 흐르는 전류가 4.9A~5.0A 사이에 있을 확률은

\[ P(4.9 < Z <5.0) \approx 0.0737 \]

즉, 약 7.37% 가 된다. 또한 7A 이상이 될 확률은

\[ P(Z \le 4.9) \approx 0.000102 \]

약 0.0102% 가 된다. 만약 멀티탭의 허용 전류가 7A 라고 한다면 0.0102% 확률로 허용 전류 이상의 전류가 흐를 수 있다는 의미가 된다.

 

Comments

  1. 위 결론은 정규 분포 랜덤 변수 2개가 서로 독립일 경우에만 성립한다. 독립이 아닌 경우에는 위의 결론을 얻을 수 없음에 주의할 것.
  2. 일반적인 확률 분포 2개의 덧셈, 뺄샘 등 일반적인 변환에 대한 내용은 --transform-- 참고.