본문 바로가기

통계17

[통계학] 5.2-(4) Example: 순서 통계량 Order Statistics 통계 모델을 세우고 무작위 샘플링을 할 때, 경우에 따라서는 가장 작은 값이나 가장 큰 값, 또는 딱 중간 위치에 있는 값들에 대하여 관심이 있을 수 있다. 예를 들어, 가스가 분출되는 관을 설계를 할 때, 가스가 분출되는 가장 큰 압력을 견딜 수 있도록 설계하기 위해서는 실험의 최대값에 대하여 관심이 있을 것이다. 또한 분포가 상당히 비대칭적인 경우 이러한 분포를 대표하는 값으로 평균 대신 사용하는 중앙값이 중간 위치에 있는 샘플링 결과라고 할 수 있다. 이번 페이지에서는 이렇게 샘플링 값의 순서에 대한 값인 order statustics에 대하여 살펴본다. # Order Satstistics DEFINITION Order Statistics Random sample \(X_1\), \(X_2\), ... 2022. 3. 1.
[통계학] 5.2-(1) Example: 정규 분포에서의 샘플 평균, 샘플 분산 Sample mean and Sample variance of Random sample from Normal Distribution 이번 페이지에서는 기초 통계학에서 가장 중요하게 활용되는, 정규 분포에서 샘플링을 했을 때 얻어지는 몇 가지 결론들에 대하여 살펴본다. 여기에서 나오는 결론들은 앞으로 나오게 될 Z-test, t-test 등에서 계속 사용하게 될 것이다. #Distribution of Sample mean and Sample Variance 지난 페이지에서 sample mean과 sample variance가 random variable이다는 것을 살펴보았다. 따라서 sample mean과 sample variance는 특정한 확률 분포를 가지고 있을 것인데, 특히 모분포가 정규 분포인 경우에는 다음과 같은 분포를 따르게 된다. THEOREM Sampling from Normal Distribution \(X_1\), .. 2021. 8. 11.
[통계학] 5.2 통계량, 샘플 평균, 샘플 분산 Statistic, Sample Mean and Sample Variance 데이터 분석이나 통계 분석을 할 때, 측정이나 실험을 위한 샘플을 추출한 후, 측정을 하고나면 가장 먼저 구하는 것이 측정치의 평균과 분산일 것이다. 우리가 통계 분석을 하면서 이렇게 평균과 분산을 구하는 이유는 샘플들의 측정값들은 양이 많기 때문에 샘플, 더 나아가서 모집단을 특징지을 수 있는 몇 개의 수들로 표현하고자 함이다. 이렇게 모집단을 특징지을 수 있는 몇 개의 수들은 통계학에서 statistic이라는 개념으로 정의된다. 이번 페이지에서는 statistic의 정의를 살펴보고, 그 예로써 샘플 평균과 샘플 분산에 대하여 알아보자. #Statistic DEFINITION Statistic \(X_1\), ..., \(X_n\) 을 모집단에서 추출한 \(n\) 개의 random sample이라고 하.. 2021. 8. 11.
[통계학] 5.1 무작위 추출 Random Samples 지금까지 여러 페이지를 통해 확률과 확률 분포에 대한 기초적인 수학 개념들을 살펴보았다. 그러나 이 내용들을 현실에 그대로 적용하기에는 어려움이 따른다. 가장 큰 어려움은 개별 event들이 얼마만큼의 비중으로 존재하는지 완벽히 파악하는 것이 거의 불가능에 가깝다는 것이다. 이렇게 모든 event들에 대한 정보를 완벽히 파악할 수 없을 때 사용할 수 있는 방법이 바로 통계적 방법론들이다. 이 페이지부터는 통계학에서 사용하는 개념들을 살펴보고 이에 대한 예제들을 살펴보도록 하자. #Random Samples 흔히 어떤 실험이나 측정에 대하여 통계적인 계산을 하려고 한다면, 샘플을 추출하고 측정을 한 후, 평균이나 분산을 구하는 등의 계산을 할 것이다. 이러한 프로세스의 첫 단계인 샘플을 추출하는 작업을 수.. 2021. 8. 10.
[통계학] 4.5-(2) Example: 이변량 정규 분포 Bivariate Normal Distribution Random variable \(X\) 와 \(Y\) 가 각각 정규 분포를 따를 때, 지금까지는 \(X\) 와 \(Y\) 가 독립인 경우만 살펴보았다. 그러나 \(X\), \(Y\) 가 각각 정규 분포라고 하더라도 반드시 두 random variable이 독립일 필요는 없다. 이번 페이지에서는 2-변량 정규 분포에 대하여 정의하고 기본 특징에 대하여 살펴보자. #Bivariate Normal Distribution DEFINITION 상수 \(-\infty < \mu_X < \infty\), \(-\infty < \mu_Y < \infty\), \(0 < \sigma_X\), \(0 < \sigma_Y\), \(-1 < \rho < 1\) 에 대하여, 다음과 같은 joint pdf를 가지는 분포를 biv.. 2021. 8. 9.
[통계학] 4.5-(1) Example: 랜덤 변수 덧셈의 분산 Variance of the Addition of Random Variables 2.3 분산, 모멘트 생성 함수 Variance, Moment Generating Functions에서 다음과 같은 분산의 성질에 대하여 살펴보았다. \[ \text{Var}(aX+b) = a^2 \text{Var}(X) \] 이번 페이지에서는 위 식의 더 일반적인 형태로 다음의 정리를 살펴본다. THEOREM Random variable \(X\), \(Y\), 상수 \(a\), \(b\) 에 대하여, \[ \begin{equation} \text{Var}(aX+bY) = a^2 \text{Var}(X) + b^2 \text{Var}(Y) + 2ab \text{Cov}(X,Y) \label{varadd} \end{equation} \] 만약 \(X\) 와 \(Y\) 가 서로 독립이면, 다음이 성립한다... 2021. 8. 9.
[통계학] 4.5 공분산, 상관계수 Covariance, Correlation 4.3 서로 독립인 두 개의 랜덤 변수 Bivariate Independent Random Variables 페이지에서 두 랜덤 변수가 독립인 경우를 다루었다. 하지만 현실에서 측정치나 통계치들은 서로 연관되어 있는 경우가 훨씬 많다. 예를 들어, 한라산에서 각 지점의 고도와 온도를 측정하는 경우, 고도가 높을 수록 온도가 낮게 측정될 것이다. 또 다른 예로 종이의 크기와 무게를 측정하는 경우에도 이 두 값은 서로 연관되어 있다. 이 페이지에서는 이렇게 서로 연관되어 있는 랜덤 변수들이 얼마나 하게 연결되어 있는지를 보여주는 여러 지표 중 공분산과 상관계수에 대하여 살펴볼 것이다. #Relation Between Random Variables? 먼저 랜덤 변수들이 강한 연관 관계에 있다는 것이 어떤 의미.. 2021. 8. 9.
[통계학] 4.4-(2) Example: 서로 독립인 정규 분포의 덧셈과 차 서로 독립인 랜덤 변수 \(X\) 와 \(Y\) 가 각각 다음과 같은 정규 분포를 따른다고 하자. \[ X \sim \mathcal{N}(\mu,\sigma^2) ~~~,~~~ Y \sim \mathcal{N}(\gamma,\sigma^2) \] \(X\) 와 \(Y\) 를 이용하여 새로운 랜덤 변수 \(U=X+Y\) 와 \(V=X-Y\) 를 정의하면, 이 두 랜덤 변수는 서로 독립일까? 이를 확인하기 위하여, \(X\) 와 \(Y\) 의 joint pdf를 \(U\) 와 \(V\) 로 변환해보자. 먼저 \(X\) 와 \(Y\) 는 서로 독립이므로, joint pdf는 \[ f_{X,Y} (x,y) = \left\{ \frac{1}{\sqrt{2\pi \sigma^2}} e^{-\frac{1}{2\sig.. 2021. 8. 7.