많은 실험이나 조사에서 어떤 현상의 random variable을 직접 다루기 보다는 random variable을 변형하여 사용하기도 한다. 인구 통계나 GDP 통계와 같이 절대적 변화량보다 상대적 변화량이 중요한 통계의 경우 random variable에 로그를 이용하여 변형 후 다루기도 한다. 이렇게 변형된 random variable의 cdf, pdf 1는 당연히 변형되기 이전 random variable의 cdf, pdf와 연관된 다른 형태로 변형될 것이다. 이번 페이지에서는 이와 같은 random variable이 transformation되면 cdf, pdf가 어떻게 변환되는지 살펴본다. 2
Examples 1
Random variable
그런데
임을 알 수 있다. 그리고
를 구할 수 있다.
Example 2
만약 새로운 random variable
위의 경우와는 다르게,
또한 pdf는
을 구할 수 있다.
Example 3
더 복잡한 경우로 새로운 random variable
그리고 pdf는
가 된다.
#Monotone Case
위에서 보는 바와 같이 cdf의 정의상, transformation에 따라 pdf를 구하는 것이 복잡해진다. 예제에서 보는 바와 같이 계속 증가하는 함수나 감소하는 함수의 경우는 상대적으로 쉽게 구할 수 있다. 내용에 필요한 개념부터 정의하자.
DEFINITION Support of Function
함수
에 대하여, 함수값이 0이 아닌 의 원소들의 집합을 로 쓰고 의 support라고 부른다.
예를 들어,
DEFINITION Monotone Function
함수
이
①
이면, 를 항상 만족하면 를 strictly increasing function이라고 한다.
②
이면, 를 항상 만족하면 를 non-decreasing function이라고 한다.
③
이면, 를 항상 만족하면 를 strictly decreasing function이라고 한다.
④
이면, 를 항상 만족하면 를 non-increasing function이라고 한다.
위 케이스 중 하나 이상에 해당할 경우
가 monotone이라고 부른다.
처음에 살펴본 예제와 같이 transform이 monotone function의 경우 cdf를 간단한 식으로 구할 수 있다.
THEOREM
Random variable
에 대하여 새로운 random variable 라고 하고, 집합 를 다음과 같이 정의하자.
①
가 increasing function인 경우,
②
가 decreasing function이고 가 continuous random variable인 경우
(증명)
①
이므로
②
이므로
(증명끝)
위 결과를 직접 미분함으로써 monotone transform에 대한 pdf를 얻을 수 있다.
THEOREM
Random variable
, continuous pdf 에 대하여 새로운 random variable 가 에 대한 increasing 또는 decreasing function이고, 의 continuous derivative가 존재한다고 하자. 또한 집합 를 다음과 같이 정의하자.
그러면 transformed random variable
에 대한 pdf 는 다음과 같이 주어진다.
#General Case
일반적으로는 transform이 항상 increasing 또는 decreasing라고 할 수는 없을 것이다. 그럼에도 어떤 영역에서는 increasing이고 다른 영역에서는 decreasing이고 다시 increasing, decreasing 이런 식으로 나눌 수 있는 경우가 많다. 예를 들어, sine 함수의 경우 0~
THEOREM
Random variable
에 대하여 새로운 random variable 라고 하자. 또한 를 , 가 각 에 대하여 continuous하도록 partition , , , ..., 으로 나눌 수 있다고 하자. 그리고 각 에 다음을 만족하는 함수 를 정의할 수 있다고 하자.
①
에 대하여,
②
에서 는 increasing 또는 decreasing
③
에 대하여,
④
의 continuous derivative가 존재
그러면
의 pdf는 다음과 같다.
으로 설정하면,
①
②
③
④
따라서 위의 조건들을 모두 만족함을 알 수 있다. 위의 정리에 의해
Examples
1. Chi Squared Distributions
일 때, 4
2. General Support
일 때,
로 설정할 수 있다. 그러나 문제는
③
따라서 위의 정리를 그대로 활용할 수는 없다. 대신
다만, 이러한 경우
이므로,
이 내용을 일반화하면 다음과 같다.
THEOREM
Random variable
에 대하여 새로운 random variable 라고 하자. 또한 , 가 각 에 대하여 continuous하도록 를 포함하는 partition , , , ..., 으로 나눌 수 있다고 하자. 그리고 각 에 다음을 만족하는 함수 를 정의할 수 있다고 하자.
①
에 대하여,
②
에서 는 increasing 또는 decreasing
③
에 대하여,
④
의 continuous derivative가 존재
각
에서 에 대하여 으로 확장하면, 의 pdf는 다음과 같다.
- cumulative distribution function(누적분포함수), 자세한 내용은 1.5 누적 분포 함수 Cumulative Distribution Functions 참고. [본문으로]
- probability density function(확률 밀도 함수), 1.6 확률 질량 함수, 확률 밀도 함수 Probability Mass Function, Probability Density Function 참고 [본문으로]
의 경우 이다. [본문으로]- 이 pdf를 standard normal distribution이라고 한다. 3.7-① 표준 정규 분포 Standard Normal Distribution 참고. [본문으로]
- 이러한 pdf를 chi squared distribution with 1 degree of freedom이라고 한다. --chi square-- 참고. [본문으로]
'Mathematics > 통계학' 카테고리의 다른 글
[통계학] 3.1 이산 균등 분포 Discrete Uniform Distribution (0) | 2020.07.24 |
---|---|
[통계학] 2.3 분산, 모멘트 생성 함수 Variance, Moment Generating Functions (2) | 2020.07.24 |
[통계학] 2.2 기대값 Expected Values (0) | 2020.07.23 |
[통계학] 1.6 확률 질량 함수, 확률 밀도 함수 Probability Mass Function, Probability Density Function (0) | 2020.07.14 |
[통계학] 1.5 누적 분포 함수 Cumulative Distribution Functions (4) | 2020.07.14 |
[통계학] 1.4 랜덤 변수 Random Variables (0) | 2020.07.01 |