본문 바로가기
Mathematics/통계학

[통계학] 3.7-① 표준 정규 분포 Standard Normal Distribution

by 피그티 2020. 10. 7.

평균 \(\mu\) 가 0이고 표준편차 \(\sigma\) 가 1인 normal distribution \(\mathcal{N}(0,1)\) 을 특별히 standard normal distribution(표준 정규 분포)라고 부른다.

\[ \begin{equation} f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \label{pdf:snd} \end{equation} \]

모든 normal distribution은 비슷한 모양을 가지고 있어서, 하나의 normal distribution을 정확히 알고 있으면, 다른 값의 평균과 표준편차를 가지는 normal distribution을 쉽게 구할 수 있다. 따라서 standard normal distribution만 정확히 알고 있으면, 랜덤 변수의 변환을 통해 모든 normal distribution을 정확히 구해낼 수 있다.

 

#From \(\mathcal{N}(\mu,\sigma^2)\) To \(\mathcal{N}(0,1)\)

랜덤 변수 \(X\) 가 \(\mathcal{N}(\mu,\sigma^2)\) 을 따를 때, 다음과 같이 새로운 랜덤 변수 \(Z\) 를 생각해보자.

\[ \begin{equation} Z = g(X) = \frac{X-\mu}{\sigma} \label{transform:rv} \end{equation} \]

\(\mathcal{N}(\mu,\sigma^2)\) 의 pdf

\[ f_X(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma}} \]

로부터 랜덤 변수의 변환[각주:1]을 이용하면, \(Z\) 의 pdf는

\[ f_Z(z) = f_X(g^{-1}(z)) \left| \frac{d}{dz}g^{-1} \right| = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} \]

로 standard normal distribution의 pdf 식 \(\eqref{pdf:snd}\)를 얻게 된다. 즉, 식 \(\eqref{transform:rv}\)는 normal distribution에서 standard normal distribution을 얻어내는 식이라고 할 수 있다. 반대로 standard normal distribution에서 원하는 평균과 표준편차의 normal distribution을 얻을 수도 있다.

 

 

THEOREM            Normal Distribution   ↔   Standard Normal Distribution

 

평균이 \(\mu\) , 표준편차가 \(\sigma\) 인 normal distribution \(X\) 를 다음과 같은 변환으로 standard normal distribution \(Z\) 를 얻을 수 있다.

\[ Z = \frac{X-\mu}{\sigma} \]

반대로, standard normal distribution \(Z\) 를 다음과 같은 변환으로, 평균이 \(\mu\) , 표준편차가 \(\sigma\) 인 normal distribution \(X\) 를 얻을 수 있다.

\[ X = \sigma Z + \mu \]

 

Example

실제로 normal distribution에서 확률 계산을 standard normal distribution을 이용하여 계산하는 방법을 살펴보자. \(X \sim \mathcal{N}(3,16)\) 에 대하여, 

 

① \(X < 11\) 일 확률은

\[ P(X<11) = P\left( \frac{X-3}{4} < \frac{11-3}{4} \right) = P(Z<2) \]

이므로 standard normal distribution에서 2보다 작을 확률과 같다.

 

② 같은 방식으로 \(X>-1\) 일 확률은

\[ P(X>-1) = P\left( \frac{X-3}{4} > \frac{-1-3}{4} \right) = P(Z>-1) \]

이므로 standard normal distribution에서 -1보다 클 확률과 같다.

 

③ \( 2<X<7\) 일 확률은

\[ P(2<X<7) = P\left( \frac{2-3}{4} < \frac{X-3}{4} < \frac{7-3}{4} \right) = P\left( \frac{1}{4} < Z < 1 \right) \]

이므로 standard normal distribution에서 1/4보다 크고 1보다 작을 확률과 같다.

 

Standard normal distribution에서 \(P(Z<2)\) , \(P(Z>-1)\) , \(P\left( \frac{1}{4} < Z < 1 \right)\) 와 같은 값들은 https://en.wikipedia.org/wiki/Standard_normal_table 에서 확인할 수 있다. 예를 들어, \(P(Z<2)\) 의 값은

\[ P(Z<2) = P(Z<0) + P(0\le Z < 2) \]

에서 standard normal distribution이 \(z=0\) 에서 대칭이므로, \(P(Z<0) = \frac{1}{2}\) 이고, \(P(0\le Z<2) = 0.47725\)[각주:2] 이므로

\[ P(Z<2) = 0.5 + 0.47725 = 0.97725 \]

임을 구할 수 있다. 따라서, 평균 3, 표준편차 4인 normal distribution에서 11보다 작을 확률은 0.97725가 된다.

 

 

  1. 식 \(\eqref{transform:rv}\)가 실수 영역에서 increasing function이다. 랜덤 변수 변환에 대한 자세한 내용은 2.1 랜덤 변수의 변환 Transformations of Random Variabls 참고. [본문으로]
  2. 링크의 3.1절 Cumulative from mean (0 to Z) 테이블확인. [본문으로]