각각의 실행 때마다 어떤 체인으로 관측이 될지 궁금한 경우도 있겠지만, 여러번 실행한 결과가 어떻게 될지 궁금한 경우도 있을 것이다. 예를 들어, 넷플릭스에 회원가입한 상태를 E, 구독하여 구독료를 내고 있는 상태를 A라고 했을 때, 아래 그림대로 transition probability를 가진다고 가정해보자. 이번달에 구독하고 있는 유저는 다음달에 구독을 유지할 확률(
Joxemai4, CC BY-SA 3.0, via Wikimedia Commons
만약 이번달에 비구독 가입상태인 유저가 천만명, 구독 상태인 유저가 2천만명이라고 했을 때, 다음달에는 비구독인 가입자와 구독 가입자의 수는 어떻게 변할까?
먼저, 다음달이 되면 비구독 유저 천만명 중에서 70%인 7백만명이 신규로 구독하게 될 것이다. 그러나 기존 구독 유저 중 40%인 8백만명이 구독을 해지하게 될 것이므로, 총 백만명이 감소한 1900만명이 구독 유저, 1100만명이 비구독 유저가 될 것이다. 그 다음달에는 다시 1900만명 중 40%가 해지하고, 1100만명 중 70%가 신규 구독하여, 1910만명의 유저가 구독하게 될 것이다.
#transition matrix
이 계산을 일반화하기 위하여, 가능한 state를 1, 2, ...,
이 식은 행렬의 곱으로 표현이 가능하다. 행렬
로 쓰고, 행렬
로 쓴다면, 위 식은 다음과 같은 행렬의 곱으로 표현된다.
이 때 transition probability 값들을 성분으로 가지는 행렬
넷플릭스 예제를 적용하기 위해 E를 1번째 state, A를 2번째 state라고 하자. 그러면 transition matrix는
그리고
따라서
그리고
처럼
만약 initial state가 하나의 값이 아니라 확률 분포
로 계산할 수 있다. 넷플릭스 예제에서 1번째 state에 1/3, 2번째 state에 2/3 비율로 분포해 있으므로, 이 식을 이용해 1달이 지난 시점, 2달이 지난 시점의 비구독자, 구독자 분포를 계산할 수 있다.
또한, initial state가 E일 때,
로 설정하고
#stochastic matrix
잠시 넷플릭스 예제의 transition matrix를 살펴보자.
행렬의 각 행의 합을 살펴보면 모두 1이라는 것을 확인할 수 있다. transition matrix는 각 항이 반드시 1이 되는데, 이러한 성질은 각 성분값이 가지는 의미를 생각해보면 당연하다.
먼저, 행,열 (1,1) 위치에 있는 0.3은 현재 E에 있을 때, E에 그대로 있을 확률이다. (1,2) 위치에 있는 0.7은 현재 E에 있을 때, A로 전이될 확률이다. 이 둘을 합한 값은 현재 E에 있을 때, 다음에 E 또는 A에 있을 확률, 사실상 어디에든 있을 확률이므로 당연히 1이 되어야 한다. stochastic process가
DEFINITION stochastic matrix행렬 가 행, 열 성분 p_{ij}에 대하여, 을 만족하는 경우, 를 stochastic matrix라고 부른다.
당연히, Markov chain의 transition matrix는 stochastic matrix의 일종이다.
'Etc > 확률 과정' 카테고리의 다른 글
[확률과정] 1.3-(2) Example: Queueing Model (1) (1) | 2024.01.10 |
---|---|
[확률과정] 1.3-(1) Example: Random Walk (1) (5) | 2024.01.09 |
[확률과정] 1.2 Markov Chain (1) | 2023.12.31 |
[확률과정] 1.1 Stochastic process (3) | 2023.12.31 |