본문 바로가기
Mathematics/통계학

[통계학] 2.2 기대값 Expected Values

by 피그티 2020. 7. 23.

어떤 통계값을 대표하고자 할 때 사용하는 개념으로 평균을 가장 많이 사용한다. 평균의 개념은 분포에서 극단적인 끝 값이 아닌 중간의 값, 가장 많이 나올 것으로 예상되는 값의 의미를 가진다. 이러한 평균의 개념을 일반화한 개념이 expected value(기대값)이다. 이번 페이지에서는 expected value에 대하여 살표본다.

 

#Expected Values

확률론에서 expected value는 다음과 같이 정의된다.

 

 

DEFINITION            Expected Values of Random Variables

 

Random variable XfX(x) 를 pmf 또는 pdf로 가질 때, 다음 값 E[X]Xexpected value라고 한다.

E[X]={xfX(x) dxif X is continuousfX>0xfX(x)if X is discrete

만약 적분이나 무한급수가 발산하는 경우 expected value는 존재하지 않는다.

 

Expected Value를 계산하기 위해서 다음과 같은 성질을 이용하여 더 쉽게 계산할 수 있다. 이 성질들의 주요 내용은 적분과 급수의 성질로부터 쉽게 유도할 수 있다. 증명은 생락한다.

 

 

THEOREM            Properties of Expected Values

 

X, Y 를 random variable, a 를 상수라고 하자. 

 

     ① Linearity

E[X+Y]=E[X]+E[Y]E[aX]=aE[X]

     ② Non-negativity: 만약 X0 이면[각주:1], E[X]0

 

     ③ Monotonicity: 만약 XY 이면[각주:2], E[X]E[Y]

 

     ④ Law of the unconscious statistician: 함수 g에 대하여, 새로운 random variable g(X)의 expected value는

E[g(X)]=g(x)f(x) dx

     ⑤ Non-degeneracy: 만약 E[|X|]=0 이면, X=0 [각주:3]

 

 

Examples

1. Finite Sample Space Case

 

Finite sample space의 random variableX의 값으로 x1, x2, ..., xn이 가능한 경우

fX(xi)=P(X=xi)=the number of X=xi casesthe number of all cases

이므로[각주:4]

E[X]=1nxi×the number of X=xi casesthe number of all cases=the mean of X

즉, X의 평균이 됨을 알 수 있다.

 

 

2. Exponential Distributions

 

Random variable의 pdf가 다음과 같은 경우 exponential (λ) distribution이라고 한다.

fX(x)=1λexλ

이 pdf에 대한 expected value를 구하면,

E[X]=0xλexλ dx=xexλ|0+0exλ dx=λ

 

3. Standard Cauchy Distributions

 

Random variable의 pdf가 다음과 같은 경우 standard Cauchy distribution이라고 한다.

fX(x)=1π(1+x2)     -<x<

 

Cauchy pdf

Cauchy Distributions, 보라색 그래프가 Standard Cauchy Distribution

Skbkekas / CC BY via Wikimedia

 

그래프에서 볼 수 있듯이 fX(x)x=0 을 중심으로 대칭임을 알 수 있다. 그래서 Expected value를 0으로 예상하기 쉽다. 실제 Expected value는

E[X]=1πx×11+x2 dx

가 된다. 이 적분 값이 0일 것으로 예상하기 쉬우나 실제로는 적분불가능이다. E[X]를 계산하기 위해서 

E[X]    limAAAx1+x2 dx

를 계산하면 이 식은 0이 된다. 그러나

E[X]    limA2AAx1+x2 dx

를 계산하면,

limA2AAx1+x2 dx=limA12ln(1+A1+4A)=12ln14

즉, 0이 아닌값이 나온다. 따라서 수렴하는 적분값이 없다. 또는 Lebesgue 적분론에서 f dx 가 적분가능이기 위해서는 |f| dx가 적분가능이어야 하는데

1π|x1+x2| dx=2π0x1+x2 dx          

이므로 적분불가능임을 알 수 있다.

 

 

 

  1. 정확히 모든 영역에서 X0 일 필요는 없다. Almost everywhere에서 만족하면 충분함. Almost everywhere에 대해서는 --Lebesgue,AE-- 참고. [본문으로]
  2. Almost everywhere에서 만족하면 충분함. [본문으로]
  3. 정확히는 almost everywhere에서 X=0 [본문으로]
  4. 1.2 확률 Probability 참고. [본문으로]