본문 바로가기
Etc/확률 과정

[확률과정] 1.1 Stochastic process

by 피그티 2023. 12. 31.

시간에 따라 일어나는 일어나는 일들이 확률에 따라 결정되는 현상을 수학적으로 기술한 것을 stochastic process(확률 과정)이라고 부른다.

 

예를 들어, 점심 메뉴를 한식, 중식, 일식, 양식, 분식 중에서 고르는 상황을 상상해보자. 어제 한식을 먹었다고 한다면, 오늘은 똑같은 카테고리인 한식보다는 다른 카테고리를 선택할 것이다. 그렇게 오늘 중식을 먹고, 다시 다음날 점심이 되어, 어제는 중식을 먹었으니 오늘은 양식을 먹자라고 생각할 수 있을 것이다. 이를 그림으로 나타내면,

요일 월요일 화요일 수요일 목요일 ...
카테고리 한식 중식 양식 분식 ...

 

이 경우, 한식 → 중식 → 양식 → 분식 → 일식 → ... 이렇게 점심 메뉴를 선택한다고 할 수 있다.

 

그러나 실제로 이렇게 점심 메뉴를 어제 먹은 것에 따라 완전히 결정론적으로 선택하는 사람은 없을 것이다. 물론 더 복잡하게 선택 룰을 만들 수 있다. 예를 들어, 중식을 2번 연속으로 먹지는 않는다거나, 일식, 한식은 서로 연속으로 선택한다거나 등등.. 그렇다고 하더라도, 분명히 지난주 월~목에 한식, 중식, 양식, 분식을 먹어서 금요일에 일식을 선택했는데, 이번주에는 똑같이 한식, 중식, 양식, 분식을 먹었지만 지난주와 다르게 한식을 선택하기도 한다.

 

이러한 상황을 적절히 설명하기 위해 확률을 도입할 수 있다. 월~목에 한식, 중식, 양식, 분식을 먹었을 때, 금요일에 일식을 선택할 확률을 70%, 한식은 20%, 중식은 10%라고 조건부 확률[각주:1]로 표현할 수 있다.

\[ \begin{align} P(\text{금=일식}|\text{월=한식}, \text{화=중식}, \text{수=양식}, \text{목=분식}) &= 0.7 \\ \\ P(\text{금=한식}|\text{월=한식}, \text{화=중식}, \text{수=양식}, \text{목=분식}) &= 0.2 \\ \\ P(\text{금=중식}|\text{월=한식}, \text{화=중식}, \text{수=양식}, \text{목=분식}) &= 0.1 \end{align} \]

 

이렇게 시간이 지나면서 일어나는 일들이 확률에 따라 발생하는 것을 일반화한 개념이 stochastic process이다. 주식 가격이 상승할 확률이 50%, 하락할 확률이 50%[각주:2]라고 해석하는 것도 stochastic process이다.

 

#stochastic process

다시 점심 메뉴 예제로 돌아가자. 위에서 70%, 20%, 10%는 월=한식, 화=중식, 수=양식, 목=분식 일때의 조건부 확률이다. 하지만 월요일에서 목요일까지 다른 조합으로 먹었을 경우도 있을 것이다. 또, 점심 메뉴 고르는걸 완전히 설명하려면, 월요일, 화요일 점심을 먹고 나서 수요일 점심 메뉴를 고르는 것도 들어가야한다. 이 모든 것을 확률론 개념들을 이용하여 표현해보자.

 

먼저, 가능한 모든 선택지는 한식(k), 중식(c), 일식(j), 양식(w), 분식(s)이므로 sample space[각주:3] \(\mathcal{S}\)를 다음과 같이 정의하자.

\[ \mathcal{S} = \{ k, c, j, w, s\} \]

그리고 시간 \(t\)의 점심 메뉴를 random variable[각주:4] \(X_t\)라고 하자. 1일차의 점심 메뉴를 표현하는 random variable을 \(X_1\), 2일차의 점심 메뉴 random variable은 \(X_2\), ... 식으로 표현하는 것이다. 예를 들어 "7일차 점심 메뉴는 한식"이라는 것을 "\(X_7 = k\)"로 표현한다.

 

점심 메뉴를 선택하는 stochastic process는 1일차 random variable, 2일차 random variable, ...을 모두 모아놓은 수열로 생각할 수 있다.[각주:5] 즉,

\[ X_1, X_2, X_3, ... \]

가 stochastic process이다. 이를 줄여서 간단히 \( \{X_t\}_{t=1,2,3,...} \) 으로 표현한다. 책에 따라서는 \(\{X(t)\}_{t=1,2,3,...}\) 으로 쓰기도 한다.

 

맨 처음 예제에서 월요일(1일)에서 목요일까지 순차적으로에 한식, 중식, 양식, 분식을 점심으로 선택한 event는 \( X_1=k, X_2=c, X_3=w, X_4=s \)로 표현할 수 있다.

 

시간 \(t\)의 점심 메뉴 \(X_t\)는 random variable이므로 당연히 확률을 가지고 있다. 예를 들어 \(P(X_5=w\)는 "5일에 점심이 양식일 확률"을 의미한다. 마찬가지로 \(P(X_5=w|X_1=k, X_2=c, X_3=c, X_4=j)\)는 "1일에 한식, 2일에 중식, 3일에 중식, 4일에 일식이었을 때 5일에 양식일 조건부 확률"을 의미한다. 마찬가지로, expected value, variance 등도 계산할 수 있다.

 

점심 메뉴 고르기와 같이 sample space가 유한한 경우도 있지만, 무한한 경우도 있다. 예를 들어, 주사위를 굴려서 나온 수 만큼 앞으로 전진하는 게임 같은 경우, 총 전진한 횟수의 수는 무한히 많다.

 

또한 시간 \(t\)가 1일, 2일, 3일이나 1회, 2회, 3회처럼 불연속인 경우도 있지만, 실제 시간처럼 연속인 경우도 있다. 예를 들어, 계산대가 3개인 마트에서 줄서기와 같은 경우 시간을 0보다 큰 real number로 가정할 수 있다.

 

#transition probability

stochastic process에서 \(X_t\)가 가질 수 있는 값들을 보통 state라고 부르기도 한다. 예를 들어 \(X_4=k\)는 "\(t\)가 4일 때 \(X\)의 state는 \(k\)이다"라고 설명하기도 한다. 이러한 관점에서 조건부 확률 \(P(X_5=w| X_1=k, X_2=c, X_3=c, X_4=j)\)는 \(t=1\)에서 \(X\)의 state가 \(k\), \(t=2\)에서 \(c\), \(t=3\)에서 \(c\), \(t=4\)에서 \(j\) 일 때, state \(w\)로 "전이"되는 확률이라고 해석할 수 있다. 따라서 이 조건부 확률을 transition probability라고 부른다. 앞으로는 조건부 확률을 간단히 

\[p_t(x_t | x_1, x_2, ..., x_{n-1})\]

로 표현하도록 하겠다.

 

  1. 조건부 확률에 대해서는 [통계학] 1.3 조건부 확률, 독립 사건 Conditional Probability, Independent Events [본문으로]
  2. 현재 포지션에서 왼쪽으로(또는 아래로) 이동할 확률, 오른쪽으로(또는 위로) 이동할 확률만 주어진 상황을 random walk라고 한다. 자세한 내용은 1.3-(1) Example: Random Walk (1), (페이지 작성 후 추가) [본문으로]
  3. sample space와 event에 대해서는 [통계학] 1.1 표본 공간, 사건 Sample Space, Event [본문으로]
  4. random variable에 대해서는 [통계학] 1.4 랜덤 변수 Random Variables [본문으로]
  5. stochastic process에 대한 더 자세한 정의는 (페이지 작성 후 추가) [본문으로]