본문 바로가기

Mathematics/통계학39

[통계학] 3.5 음이항 분포, 기하 분포 Negative Binomial Distribution, Geometric Distribution 성공 확률이 \(p\) 인 실험을 \(n\) 번 실행하였을 때, 성공 횟수의 분포가 이항 분포라고 한다면, 음이항 분포는 \(r\) 번의 성공을 얻기 위하여 실행한 실험 횟수의 분포이다. #Negative Binomial Distribution\(k \ge r\) 일 때, \(k\) 번째의 실험에서 \(r\) 번째의 성공을 얻기 위해서는 \(k-1\) 번째 실험까지 \(r-1\) 번의 성공이 있어야 한다. 이항 분포와 마찬가지로, \(k-1\) 번째 실험까지 \(r-1\) 번의 성공이 있을 확률은\[ \left( \begin{array}{c} k-1 \\ r-1 \end{array} \right) p^{r-1} (1-p)^{k-r} \]이고 \(k\) 번째 실험에서 성공할 확률은 \(p\) 이므로, \(.. 2020. 7. 31.
[통계학] 3.4 초기하 분포 Hypergeometric Distribution 한 상자에 \(N\) 개의 공이 들어있다. 이 중에 \(K\) 개의 공은 빨간색, \(N-K\) 개의 공은 파란색이라고 하자. 이제 \(n\) 개의 공을 꺼냈을 때, 빨간색 공이 몇 개들어 있는지에 대한 문제는 초기하 분포를 따른다. Binomial distribution는 \(n\) 개의 공을 꺼낼 때, 하나 꺼낼 때마다 확인하고 다시 집어 넣을 때의 분포가 되고, 초기하 분포는 한번에 \(n\) 개의 공을 꺼냈을 때의 분포가 된다. 이번 페이지에서는 초기하 분포에 대하여 살펴본다. #Hypergeometric Distribution상자에서 \(n\) 개의 공을 꺼낼 모든 경우의 수는\[ \left( \begin{array}{c} N \\ n \end{array} \right) = \frac{N!}{n.. 2020. 7. 25.
[통계학] 3.3 푸아송 분포, 푸아송 프로세스 Poisson Distributions, Poisson Process 어떤 현상과 현상 사이에 걸리는 시간이나 실험 횟수는 이 페이지에서 논의할 푸아송 분포로 모델링된다. 시간의 절대값보다는 기다린 시간의 길이가 사건이 벌어질 확률에 영향을 준다던지, 기다리는 시간이 길어질수록 사건 확률이 커지는 것과 같은 받아들일만한 가정들로 모델링하면 푸아송 분포를 얻게된다. 이번 페이지에서는 푸아송 분포의 정의와 평균, 분산 등을 살펴보고, 시간이 흐르면서 발생하는 사건 등을 모델링하는 방법을 살펴본다. #Poisson Distributions주어진 양수 \(\lambda\)에 대하여, 랜덤 변수 \(X\) 가 다음과 같은 pmf를 가질 때 이를 Poisson \((\lambda)\) distribution이라고 한다.\[ f_X(x) = P(X=x) = e^{-\lambda}\fr.. 2020. 7. 24.
[통계학] 3.2 베르누이 분포, 이항 분포 Bernoulli Distribution, Binomial Distribution 동전 던지기, 질병의 진단, 찬반 투표와 같이 결과가 2가지로 한정되는 실험을 Bernoulli trial이라고 부른다. 이런 실험을 여러 차례 반복하여 결과가 몇 번 나왔는지에 대한 분포가 이항 분포이다. #Bernoulli Distribution 주어진 확률 \( 0 \le p \le 1\) 에 대하여, \[ X = \left\{ \begin{array}{cl} 1 & \text{with probability } ~p \\ 0 & \text{with probability } ~(1-p) \end{array} \right.\] 를 Bernoulli distribution이라고 한다. 보통 \(X=1\) 을 '성공', \(X=0\) 를 '실패'라고 부르기도 한다. 평균과 분산은 위에 주어진 확률 분포로부.. 2020. 7. 24.
[통계학] 3.1 이산 균등 분포 Discrete Uniform Distribution 이 페이지부터 몇 페이지에 걸쳐서 이론적으로 중요하거나, 현실을 모델링하는데 유용한 기본적인 확률 분포에 대하여 기본적인 성질을 살펴본다. #Discrete Uniform Distribution주어진 자연수 \(N\)에 대하여, 불연속적인 랜덤 변수 \(X\) 가 다음의 pmf를 가질 때 이를 discrete uniform \((1,N)\) distribution이라고 한다.\[ f_X(x) = P(X=x) = \frac{1}{N} ~~~~~ \text{where } x=1,2,\cdots,N \]이름에서 알 수 있듯이 1부터 N까지의 자연수에 확률이 고르게 분포되어 있는 분포를 말한다. 모든 가능한 확률을 더하면 자연스럽게 1임을 확인할 수 있다. 랜덤 변수 \(X\)가 discrete uniform .. 2020. 7. 24.
[통계학] 2.3 분산, 모멘트 생성 함수 Variance, Moment Generating Functions 랜덤 변수의 분포를 나타내는 지표로서 평균은 랜덤 변수의 대표적인 값을 의미한다. 이에 더해, 랜덤 변수가 대표값으로부터 얼마나 떨어져 있냐는 것도 중요한 지표가 된다. 이러한 역할을 해주는 값으로 variance(분산)를 정의한다. 이번 페이지에서는 variance에 대하여 살펴보고, variance를 얻기 위해 도입되는 moment, 그리고 moment generating function에 대하여 살펴본다. #VarianceRandom variable의 variance를 다음과 같이 정의한다. DEFINITION Variances of Random Variables Random variable \(X\) 에 대하여 \(E[(X-E[X])^2]\) 을 \(X\) 의 variance라고 하고, \(\ma.. 2020. 7. 24.
[통계학] 2.2 기대값 Expected Values 어떤 통계값을 대표하고자 할 때 사용하는 개념으로 평균을 가장 많이 사용한다. 평균의 개념은 분포에서 극단적인 끝 값이 아닌 중간의 값, 가장 많이 나올 것으로 예상되는 값의 의미를 가진다. 이러한 평균의 개념을 일반화한 개념이 expected value(기대값)이다. 이번 페이지에서는 expected value에 대하여 살표본다. #Expected Values 확률론에서 expected value는 다음과 같이 정의된다. DEFINITION Expected Values of Random Variables Random variable \(X\) 가 \(f_X(x)\) 를 pmf 또는 pdf로 가질 때, 다음 값 \(E[X]\) 를 \(X\)의 expected value라고 한다. \[ \begin{equ.. 2020. 7. 23.
[통계학] 2.1 랜덤 변수의 변환 (1) Transformations of Random Variables (1) 많은 실험이나 조사에서 어떤 현상의 random variable을 직접 다루기 보다는 random variable을 변형하여 사용하기도 한다. 인구 통계나 GDP 통계와 같이 절대적 변화량보다 상대적 변화량이 중요한 통계의 경우 random variable에 로그를 이용하여 변형 후 다루기도 한다. 이렇게 변형된 random variable의 cdf[각주:1], pdf[각주:2]는 당연히 변형되기 이전 random variable의 cdf, pdf와 연관된 다른 형태로 변형될 것이다. 이번 페이지에서는 이와 같은 random variable이 transformation되면 cdf, pdf가 어떻게 변환되는지 살펴본다. Examples 1 Random variable \(X\) 에 대하여 cdf를 \(F_.. 2020. 7. 23.