우리가 통계학적 도구를 사용하는 이유는 전체 분포를 알 수 없기 때문에 적당한 샘플링을 통해 전체 분포의 특징을 알아내기 위함이다. 이러한 방법이 작동하는 것은 샘플링해서 얻은 분포가 전체 분포와 비슷할 때일 것이다. 보통 샘플의 개수가 많아질 수록, 샘플로부터 얻은 값들이 모분포의 값으로 "수렴"해 간다는 것을 전제한다.
그러나 확률 변수가 어떤 확률 변수로 수렴해 간다는 미적분학에서 살펴보던 수열의 수렴과는 조금 양상이 다르다. 예를 들어, 보통 많이 사용하는 통계량인 샘플 평균에 대해서 생각해보자. A은 1,2,3,4,5의 카드 중에서 무작위로 계속 뽑고, B는 3의 카드만 계속 뽑는 경우에 카드를 계속하여 뽑을 수록 A의 샘플 평균은 B의 샘플 평균은 3에 점점 수렴하게 될 것이다. 하지만 A가 마주하게될 분포는 시간이 지나더라도 B의 분포와 비슷하게 될 수 없다. 즉, A의 샘플 평균이 B의 샘플 평균에 점점 수렴한다고 해서 B의 분포를 통해 A의 분포를 알수는 없다.
이번 페이지에서는 확률 변수의 수렴에 대한 몇가지 개념들을 살펴본다. 미적분학이나, 해석학에 익숙하지 않다면 다음으로 넘어가도 무방하다. 이하에서는
#Convergence in Distribution
가장 생각하기 쉬운 수렴 개념은,
DEFINITION Convergence in Distribution
Random variable의 수열, , … 의 cdf가 모든 에 대하여,
인 경우,, , ... 이 로 converge in distribution라고 부르고 로 표기한다.
간단히,
#Convergence in Probability
이 수렴의 기본 아이디어는
DEFINITION Convergence in Probability
Random variable의 수열, , ... 가 모든 양수 에 대하여,
이면,, , ... 이 로 converge in probability라고 부르고, 로 표기한다.
Convergence in probability는 convergence in distribution보다 더 강한 조건인데, 이 사실은 다음 정리로부터 알 수 있다.
THEOREM
Random variable의 수열, , ... 이 이면 이다.
(증명)
여기에서는 1차원 random variable에 대해서만 살펴본다. 일반적인 random vector의 경우 이 결과를 응용하여 쉽게 얻을 수 있다. 먼저 다음 보조 정리가 필요하다.
Lemma
임의의 random variable, , 실수 , 양수 에 대하여,
보조 정리를 이용하면
따라서
이제
cdf가 almost everywhere에서 continuous이므로, 모든 양수
(증명 끝)
왜 convergence in probability와 같은 개념들이 따로 필요할까? 일반적으로 cdf의 수렴이 pdf의 수렴을 의미하지는 않는다. 예를 들어, pdf
#Almost Sure Convergence
이 수렴의 기본 아이디어는 probability function이 event space의 measure라는 관점에서 접근하는 것이다. 확률 변수 역시 event space의 함수이므로 1
DEFINITION Almost Sure Convergence
Random variable의 수열, , ... 가 random variable 에 대하여,
이면,, , ... 이 로 almost sure converge한다고 부르고, 로 표기한다.
위 정의를 event space
Random variable이 event를 하나의 숫자로 변환하는 함수이므로, 결국
Convergence almost surely가 convergence in probability보다 더 강한 조건인 것은 다음과 같이 정리된다.
THEOREM
Random variable의 수열, , ... 이 이면 이다.
(증명)
Almost sure convergence을 limit infimum의 개념을 통해 정리하면, 임의의 양수
이므로, Fatou's lemma를 적용하면 곧바로 convergence in probability를 얻을 수 있다.
(증명 끝)
Convergent in probability이면 convergent in distribtuion이므로, convergent almost surely이면 convergent in distribution이다.
Example 1.
닫힌 구간
- -- Lebesgue, measure 참고-- [본문으로]
- 점에 해당하는 event의 확률은 0이다. 자세한 내용은 1.6 확률 질량 함수, 확률 밀도 함수 Probability Mass Function, Probability Density Function 참고. [본문으로]
'Mathematics > 통계학' 카테고리의 다른 글
[통계학] 5.3-(2) 큰 수의 법칙 Law of Large Numbers (0) | 2022.04.27 |
---|---|
[통계학] 5.2-(4) Example: 순서 통계량 Order Statistics (1) | 2022.03.01 |
[통계학] 5.2-(3) F 분포 F-distribution (0) | 2021.08.17 |
[통계학] 5.2-(2) 스튜던트 t 분포 Student's t-distribution (0) | 2021.08.16 |
[통계학] 5.2-(1) Example: 정규 분포에서의 샘플 평균, 샘플 분산 Sample mean and Sample variance of Random sample from Normal Distribution (0) | 2021.08.11 |
[통계학] 5.2 통계량, 샘플 평균, 샘플 분산 Statistic, Sample Mean and Sample Variance (0) | 2021.08.11 |