평균 \(\mu\) 가 0이고 표준편차 \(\sigma\) 가 1인 normal distribution \(\mathcal{N}(0,1)\) 을 특별히 standard normal distribution(표준 정규 분포)라고 부른다.
\[ \begin{equation} f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \label{pdf:snd} \end{equation} \]
모든 normal distribution은 비슷한 모양을 가지고 있어서, 하나의 normal distribution을 정확히 알고 있으면, 다른 값의 평균과 표준편차를 가지는 normal distribution을 쉽게 구할 수 있다. 따라서 standard normal distribution만 정확히 알고 있으면, 랜덤 변수의 변환을 통해 모든 normal distribution을 정확히 구해낼 수 있다.
#From \(\mathcal{N}(\mu,\sigma^2)\) To \(\mathcal{N}(0,1)\)
랜덤 변수 \(X\) 가 \(\mathcal{N}(\mu,\sigma^2)\) 을 따를 때, 다음과 같이 새로운 랜덤 변수 \(Z\) 를 생각해보자.
\[ \begin{equation} Z = g(X) = \frac{X-\mu}{\sigma} \label{transform:rv} \end{equation} \]
\(\mathcal{N}(\mu,\sigma^2)\) 의 pdf
\[ f_X(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma}} \]
로부터 랜덤 변수의 변환을 이용하면, \(Z\) 의 pdf는 1
\[ f_Z(z) = f_X(g^{-1}(z)) \left| \frac{d}{dz}g^{-1} \right| = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \]
로 standard normal distribution의 pdf 식 \(\eqref{pdf:snd}\)를 얻게 된다. 즉, 식 \(\eqref{transform:rv}\)는 normal distribution에서 standard normal distribution을 얻어내는 식이라고 할 수 있다. 반대로 standard normal distribution에서 원하는 평균과 표준편차의 normal distribution을 얻을 수도 있다.
THEOREM Normal Distribution ↔ Standard Normal Distribution
평균이 \(\mu\) , 표준편차가 \(\sigma\) 인 normal distribution \(X\) 를 다음과 같은 변환으로 standard normal distribution \(Z\) 를 얻을 수 있다.
\[ Z = \frac{X-\mu}{\sigma} \]
반대로, standard normal distribution \(Z\) 를 다음과 같은 변환으로, 평균이 \(\mu\) , 표준편차가 \(\sigma\) 인 normal distribution \(X\) 를 얻을 수 있다.
\[ X = \sigma Z + \mu \]
Example
실제로 normal distribution에서 확률 계산을 standard normal distribution을 이용하여 계산하는 방법을 살펴보자. \(X \sim \mathcal{N}(3,16)\) 에 대하여,
① \(X < 11\) 일 확률은
\[ P(X<11) = P\left( \frac{X-3}{4} < \frac{11-3}{4} \right) = P(Z<2) \]
이므로 standard normal distribution에서 2보다 작을 확률과 같다.
② 같은 방식으로 \(X>-1\) 일 확률은
\[ P(X>-1) = P\left( \frac{X-3}{4} > \frac{-1-3}{4} \right) = P(Z>-1) \]
이므로 standard normal distribution에서 -1보다 클 확률과 같다.
③ \( 2<X<7\) 일 확률은
\[ P(2<X<7) = P\left( \frac{2-3}{4} < \frac{X-3}{4} < \frac{7-3}{4} \right) = P\left( \frac{1}{4} < Z < 1 \right) \]
이므로 standard normal distribution에서 1/4보다 크고 1보다 작을 확률과 같다.
Standard normal distribution에서 \(P(Z<2)\) , \(P(Z>-1)\) , \(P\left( \frac{1}{4} < Z < 1 \right)\) 와 같은 값들은 https://en.wikipedia.org/wiki/Standard_normal_table 에서 확인할 수 있다. 예를 들어, \(P(Z<2)\) 의 값은
\[ P(Z<2) = P(Z<0) + P(0\le Z < 2) \]
에서 standard normal distribution이 \(z=0\) 에서 대칭이므로, \(P(Z<0) = \frac{1}{2}\) 이고, \(P(0\le Z<2) = 0.47725\) 이므로 2
\[ P(Z<2) = 0.5 + 0.47725 = 0.97725 \]
임을 구할 수 있다. 따라서, 평균 3, 표준편차 4인 normal distribution에서 11보다 작을 확률은 0.97725가 된다.
- 식 \(\eqref{transform:rv}\)가 실수 영역에서 increasing function이다. 랜덤 변수 변환에 대한 자세한 내용은 2.1 랜덤 변수의 변환 Transformations of Random Variabls 참고. [본문으로]
- 링크의 3.1절 Cumulative from mean (0 to Z) 테이블확인. [본문으로]
'Mathematics > 통계학' 카테고리의 다른 글
[통계학] 4.2 두 개의 랜덤 변수에서 조건부 확률 Conditional Probability Distributions of Two Random Variables (0) | 2021.02.21 |
---|---|
[통계학] 4.1 다중 랜덤 변수 Multiple Random Variables (0) | 2021.02.15 |
[통계학] 2.2-(1) 최빈값, 중앙값 Mode, Median (0) | 2021.02.13 |
[통계학] 3.7 정규 분포 Normal Distribution (0) | 2020.09.29 |
[통계학] 3.6 균등 분포 Uniform Distribution (0) | 2020.08.17 |
[통계학] 3.5 음이항 분포, 기하 분포 Negative Binomial Distribution, Geometric Distribution (0) | 2020.07.31 |