서로 독립인 랜덤 변수 \(X\) 와 \(Y\) 가 각각 정규 분포를 따른다고 하자. 새로운 랜덤 변수 \(Z=X+Y\) 를 정의했을 때 \(Z\) 는 어떤 분포를 따르게 될까?
예를 들어 평균적으로 전류 2A가 흐르는 전자기기 A와 전류 3A가 흐르는 전자기기 B를 하나의 멀티탭에 연결하면, 멀티탭에 평균적으로 흐르는 전류는 5A로 예측할 수 있다. 하지만 더 구체적으로, 전류가 4.9A~5.0A 사이에 있을 확률은? 7A 이상으로 전류가 흐를 확률은? 이런 질문에 대답하기 위해서는 총 전류의 확률 분포, 즉, [A기기의 전류 + B기기의 전류]의 확률 분포에 대하여 이야기 할 수 있어야 한다.
이번 페이지에서는 독립적인 2개의 정규 분포를 따르는 랜덤 변수의 덧셈으로 정의되는 랜덤 변수의 확률 분포에 대하여 살펴본다.
COLLORARY
서로 Independent한 랜덤 변수 \(X\) 와 \(Y\) 의 mgf를 각각 \(M_X(t)\), \(M_Y(t)\) 라고 하자. 그러면 새로운 랜덤 변수 \(Z=X+Y\) 의 mgf는 다음과 같이 얻을 수 있다.
\[ M_Z(t) = M_X(t)M_Y(t) \]
랜덤 변수의 mgf의 정의 및 mgf와 pdf의 1대1 대응 관계에 대해서는 2.3 분산, 모멘트 생성 함수 Variance, Moment Generating Functions를 참고할 것.
(증명)
mgf의 정의로 부터
\[ M_Z(t) = E[e^{tZ}] = E[e^{t(X+Y)}] = E[e^{tX}e^{tY}] \]
이 때, \(X\) 와 \(Y\) 가 independent이므로
\[ E[e^{tX}e^{tY}] = E[e^{tX}]E[e^{tY}] = M_X(t) M_Y(t) \]
(End of proof)
Example
만약 \(X \sim \mathcal{N}(\mu,\sigma^2) \), \(Y \sim \mathcal{N}(\nu, \tau^2)\) 가 서로 independent라고 가정하자. 각각의 mgf는 3.7 정규 분포 Normal Distribution에서 계산한 것처럼 아래 식과 같다.
\[ M_X(t) = e^{\mu t + \frac{\sigma^2 t^2}{2}} \]
\[ M_Y(t) = e^{\nu t + \frac{\tau^2 t^2}{2}} \]
따라서 새로운 랜덤 변수 \(Z=X+Y\) 의 mgf는 위의 따름정리에 의해
\[ M_Z(t) = M_X(t)M_Y(t) = e^{(\mu+\nu)t + \frac{(\sigma^2 + \tau^2) t^2}{2}} \]
가 된다.
이 mgf는 \(\mathcal{N}(\mu+\nu, \sigma^2+\tau^2)\) 의 mgf와 동일하므로, \(Z\) 는 평균이 \(\mu +\nu\), 분산이 \(\sigma^2 + \tau^2\) 인 정규 분포를 따른다는 결론을 얻을 수 있다.
맨 처음 예제의 답을 하자면, 만약 전자기기 A의 전류 분포가 평균 2A, 오차(즉, 표준편차) 0.5A인 정규 분포를 따르고, 전자기기 B의 전류 분포가 평균 3A, 오차 0.2A인 정규 분포를 따른다면, [A의 전류 + B의 전류] 분포는 평균이 5A, 분산이 0.29(표준 편차 0.539A) 인 정규 분포를 따르게 된다.
\[ f_Z(z) = \frac{1}{\sqrt{2\pi \times 0.29}} \exp{ \left( -\frac{(z-5)^2}{2\times0.29} \right) } \]
따라서, 멀티탭에 흐르는 전류가 4.9A~5.0A 사이에 있을 확률은
\[ P(4.9 < Z <5.0) \approx 0.0737 \]
즉, 약 7.37% 가 된다. 또한 7A 이상이 될 확률은
\[ P(Z \le 4.9) \approx 0.000102 \]
약 0.0102% 가 된다. 만약 멀티탭의 허용 전류가 7A 라고 한다면 0.0102% 확률로 허용 전류 이상의 전류가 흐를 수 있다는 의미가 된다.
Comments
- 위 결론은 정규 분포 랜덤 변수 2개가 서로 독립일 경우에만 성립한다. 독립이 아닌 경우에는 위의 결론을 얻을 수 없음에 주의할 것.
- 일반적인 확률 분포 2개의 덧셈, 뺄샘 등 일반적인 변환에 대한 내용은 --transform-- 참고.
'Mathematics > 통계학' 카테고리의 다른 글
[통계학] 4.4-(2) Example: 서로 독립인 정규 분포의 덧셈과 차 (0) | 2021.08.07 |
---|---|
[통계학] 4.4-(1) Example: 계층적 확률 모델링 (0) | 2021.07.04 |
[통계학] 4.4 랜덤 변수의 변환 (2) Transformations of Random Variables (2) (2) | 2021.03.02 |
[통계학] 4.3 서로 독립인 두 개의 랜덤 변수 Bivariate Independent Random Variables (0) | 2021.02.26 |
[통계학] 4.2-(1) Example: 두 개의 랜덤 변수에서 조건부 최적 예측 (0) | 2021.02.21 |
[통계학] 4.2 두 개의 랜덤 변수에서 조건부 확률 Conditional Probability Distributions of Two Random Variables (0) | 2021.02.21 |