본문 바로가기

확률17

[통계학] 5.3-(1) 확률 변수의 수렴 Convergence of Random Variables 우리가 통계학적 도구를 사용하는 이유는 전체 분포를 알 수 없기 때문에 적당한 샘플링을 통해 전체 분포의 특징을 알아내기 위함이다. 이러한 방법이 작동하는 것은 샘플링해서 얻은 분포가 전체 분포와 비슷할 때일 것이다. 보통 샘플의 개수가 많아질 수록, 샘플로부터 얻은 값들이 모분포의 값으로 "수렴"해 간다는 것을 전제한다. 그러나 확률 변수가 어떤 확률 변수로 수렴해 간다는 미적분학에서 살펴보던 수열의 수렴과는 조금 양상이 다르다. 예를 들어, 보통 많이 사용하는 통계량인 샘플 평균에 대해서 생각해보자. A은 1,2,3,4,5의 카드 중에서 무작위로 계속 뽑고, B는 3의 카드만 계속 뽑는 경우에 카드를 계속하여 뽑을 수록 A의 샘플 평균은 B의 샘플 평균은 3에 점점 수렴하게 될 것이다. 하지만 A가 .. 2022. 3. 2.
[통계학] 5.2-(4) Example: 순서 통계량 Order Statistics 통계 모델을 세우고 무작위 샘플링을 할 때, 경우에 따라서는 가장 작은 값이나 가장 큰 값, 또는 딱 중간 위치에 있는 값들에 대하여 관심이 있을 수 있다. 예를 들어, 가스가 분출되는 관을 설계를 할 때, 가스가 분출되는 가장 큰 압력을 견딜 수 있도록 설계하기 위해서는 실험의 최대값에 대하여 관심이 있을 것이다. 또한 분포가 상당히 비대칭적인 경우 이러한 분포를 대표하는 값으로 평균 대신 사용하는 중앙값이 중간 위치에 있는 샘플링 결과라고 할 수 있다. 이번 페이지에서는 이렇게 샘플링 값의 순서에 대한 값인 order statustics에 대하여 살펴본다. # Order Satstistics DEFINITION Order Statistics Random sample \(X_1\), \(X_2\), ... 2022. 3. 1.
[통계학] 4.5-(2) Example: 이변량 정규 분포 Bivariate Normal Distribution Random variable \(X\) 와 \(Y\) 가 각각 정규 분포를 따를 때, 지금까지는 \(X\) 와 \(Y\) 가 독립인 경우만 살펴보았다. 그러나 \(X\), \(Y\) 가 각각 정규 분포라고 하더라도 반드시 두 random variable이 독립일 필요는 없다. 이번 페이지에서는 2-변량 정규 분포에 대하여 정의하고 기본 특징에 대하여 살펴보자. #Bivariate Normal Distribution DEFINITION 상수 \(-\infty < \mu_X < \infty\), \(-\infty < \mu_Y < \infty\), \(0 < \sigma_X\), \(0 < \sigma_Y\), \(-1 < \rho < 1\) 에 대하여, 다음과 같은 joint pdf를 가지는 분포를 biv.. 2021. 8. 9.
[통계학] 4.5-(1) Example: 랜덤 변수 덧셈의 분산 Variance of the Addition of Random Variables 2.3 분산, 모멘트 생성 함수 Variance, Moment Generating Functions에서 다음과 같은 분산의 성질에 대하여 살펴보았다. \[ \text{Var}(aX+b) = a^2 \text{Var}(X) \] 이번 페이지에서는 위 식의 더 일반적인 형태로 다음의 정리를 살펴본다. THEOREM Random variable \(X\), \(Y\), 상수 \(a\), \(b\) 에 대하여, \[ \begin{equation} \text{Var}(aX+bY) = a^2 \text{Var}(X) + b^2 \text{Var}(Y) + 2ab \text{Cov}(X,Y) \label{varadd} \end{equation} \] 만약 \(X\) 와 \(Y\) 가 서로 독립이면, 다음이 성립한다... 2021. 8. 9.
[통계학] 4.5 공분산, 상관계수 Covariance, Correlation 4.3 서로 독립인 두 개의 랜덤 변수 Bivariate Independent Random Variables 페이지에서 두 랜덤 변수가 독립인 경우를 다루었다. 하지만 현실에서 측정치나 통계치들은 서로 연관되어 있는 경우가 훨씬 많다. 예를 들어, 한라산에서 각 지점의 고도와 온도를 측정하는 경우, 고도가 높을 수록 온도가 낮게 측정될 것이다. 또 다른 예로 종이의 크기와 무게를 측정하는 경우에도 이 두 값은 서로 연관되어 있다. 이 페이지에서는 이렇게 서로 연관되어 있는 랜덤 변수들이 얼마나 하게 연결되어 있는지를 보여주는 여러 지표 중 공분산과 상관계수에 대하여 살펴볼 것이다. #Relation Between Random Variables? 먼저 랜덤 변수들이 강한 연관 관계에 있다는 것이 어떤 의미.. 2021. 8. 9.
[통계학] 4.4-(2) Example: 서로 독립인 정규 분포의 덧셈과 차 서로 독립인 랜덤 변수 \(X\) 와 \(Y\) 가 각각 다음과 같은 정규 분포를 따른다고 하자. \[ X \sim \mathcal{N}(\mu,\sigma^2) ~~~,~~~ Y \sim \mathcal{N}(\gamma,\sigma^2) \] \(X\) 와 \(Y\) 를 이용하여 새로운 랜덤 변수 \(U=X+Y\) 와 \(V=X-Y\) 를 정의하면, 이 두 랜덤 변수는 서로 독립일까? 이를 확인하기 위하여, \(X\) 와 \(Y\) 의 joint pdf를 \(U\) 와 \(V\) 로 변환해보자. 먼저 \(X\) 와 \(Y\) 는 서로 독립이므로, joint pdf는 \[ f_{X,Y} (x,y) = \left\{ \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{1}{2\sig.. 2021. 8. 7.
[통계학] 4.4-(1) Example: 계층적 확률 모델링 다음과 같은 질문을 생각해보자. 한 꿀벌 집단에서 하나 밖에 없는 여왕벌은 한번 산란할 때 약 100~5000개의 알을 낳는다. 정상적으로 부화하는 경우에는 산란된지 약 21일 쯤에 벌이 성장하여 알을 뚫고 나오게 된다. 그러나 어떤 알들은 부화되지 못하고 그냥 썩게된다. 그렇다면 여왕벌이 한번 산란할 때 평균적으로 얼마나 많은 알들이 부화할까? 이 질문을 확률론적으로 생각해보면, 여왕벌이 산란한 알의 개수도 100~5000개 사이에 있는 랜덤 변수가 되고, 부화한 알의 개수도 랜덤 변수가 된다. 따라서 이 질문을 다음과 같이 확률 모델로 바꿀 수 있다. 랜덤 변수 \(X\)를 부화한 알의 개수, \(Y\)를 산란한 알의 개수라고 하자. \(Y\)가 \(f_Y(y)\) 분포를 따르고, 주어진 \(Y\)에.. 2021. 7. 4.
[통계학] 4.4 랜덤 변수의 변환 (2) Transformations of Random Variables (2) 2.1 랜덤 변수의 변환 (1) Transformations of Random Variables (1)에서 랜덤 변수 1개에 대한 확률 분포의 변환에 대하여 살펴보았다. 이번 페이지에서는 랜덤 변수 2개에 대한 확률 분포의 변환에 대하여 살펴보자. #Basic Idea 2차원 랜덤 벡터 \((X,Y)\) 에 대하여, 다음과 같이 정의되는 새로운 2차원 랜덤 벡터 \((U,V)\) 를 생각해보자. \[ \begin{align*} U &= g_1(X,Y) \\ \\ V &= g_2(X,Y) \end{align*} \] 우리가 원하는 것은 관심이 있는 \((U,V)\) 의 사건 \(B\) 의 확률을 기존에 알고 있는 랜덤 벡터 \((X,Y)\) 의 확률로 표현하는 것이다. \((U,V)\) 가 사건 \(B\).. 2021. 3. 2.