지난 포스팅에서 무작위 보행 함수는 모든 함수의 값이 확률 변수라는 것을 알았습니다. 이런 함수를 확률 함수라고도 하고 확률 과정이라고도 한다고 했습니다. 그리고 평균과 분산도 구해 보았습니다. 그런데 무작위 보행 함수는 어떤 확률 분포를 따르게 될까요?
무작위 보행의 확률 분포
무작위 보행 함수 $W_n(t)$의 그래프를 그려 보았습니다. 단면을 잘라 보면 $W_n(t)$의 확률 분포를 가늠할 수 있을 겁니다. 아래 그래프는 시간 당 64 걸음씩, 2시간 동안, 255번을 무작위로 걸어 본 결과입니다. 점과 점의 사이 사이는 보간법으로 집어 넣었습니다.
$t=1$ 시점의 단면을 잘라서 얻은 $W_{64}(1)$의 값 255개로 히스토그램을 그려 보았습니다. 히스토그램과 겹쳐 놓은 그래프는 정규 분포의 확률 밀도 함수입니다. 잘 겹쳐진 것을 보니 왠지 무작위 보행 함수가 정규 분포를 따를 것 같은 느낌이 옵니다. 과연 그럴까요?
동전을 던진 회수가 충분히 크지 않다면 앞면이나 뒤면이 유독 많이 나오는 경우가 있을 수 있습니다. 하지만 회수가 충분하다면 - 특히 무한히 크다면 - 앞, 뒤면이 나온 회수가 비슷할 겁니다. 반면에 어느 한 면이 유독 많이 나오는 경우의 확률은 점점 희박해질 겁니다. 앞, 뒤면이 나온 회수가 같으면 위치는 변하지 않고, 어느 한 면이 많이 나올수록 출발점에서 멀어지게 됩니다. 따라서 위치의 확률 분포는 출발점 부근이 가장 높고 양 끝으로 멀어지는 모양이 됩니다.
이런 현상을 설명하는 것이 중심 극한 정리(Central Limit Theorem, CLT)
입니다. 중심 극한 정리의 정확한 내용은 모집단의 평균이 $\mu$이고 분산이 $\sigma^2$일 때 표본의 크기 $n$이 충분히 크다면 모집단이 어떤 분포를 따르든지 표본의 평균은 평균이 $\mu$이고 분산이 $\sigma^2\over{n}$인 정규 분포를 따른다는 것입니다.
$$\overline{x} \sim N(\mu, \frac{\sigma^2}{n})
$$
$S_n$은 동전을 $n$번 던져서 나온 $x$ 값들의 합계이므로 $S_n\over{n}$은 표본 평균이고, $n$이 충분히 커지면 중심 극한 정리에 따라 정규 분포를 따르게 됩니다.
$$
\frac{S_n}{n}=\frac{x_1+x_2+...+x_n}{n} \sim N\left(0,\frac{1}{n}\right)
$$
$$
\because E(x_i)=0, Var(x_i)=1
$$
그리고 $\frac{S_n}{\sqrt{n}}$는 표본 평균의 표준화 확률 변수이므로 표준 정규 분포를 따릅니다.
$$\frac{S_n}{\sqrt{n}} \sim N(0,1)
$$
$$\because \frac{\left(\frac{S_n}{n}-0\right)}{\sqrt{\frac{1}{n}}}=\frac{S_n}{\sqrt{n}}
$$
일단 $n$ 걸음을 걸었을 때 즉, 1 시간을 걸었을 때의 위치는 중심 극한 정리에 따라 정규 분포를 따른다는 것은 알게 되었습니다. 그런데 1 시간이 아닌 경우에도 정규 분포를 따르게 될까요? 달리 말하면 $t=1$이 아닌 다른 시점의 단면을 잘랐을 때에도 중심 극한 정리가 적용될까요?
연속 시간 확률 과정
무작위 보행 함수는 이산 시간(discrete-time)
확률 과정입니다. 10분 마다 동전을 한 번 던져서는 10분 단위로만 - 띄엄 띄엄 - 위치를 파악할 수 있기 때문입니다. 하지만 동전을 자주 던질수록 더 촘촘한 시간 단위로 위치를 파악할 수 있습니다. 따라서 동전을 무한히 많이 던진다면 무작위 보행 함수는 연속 시간(continuous-time)
확률 과정이 됩니다. 이 확률 과정을 $W_t$라고 합시다.
$$
W_t=\displaystyle\lim_{n\rightarrow\infty}{W_n(t)}=\displaystyle\lim_{n\rightarrow\infty}\left(\frac{S_{\lfloor{nt}\rfloor}}{\sqrt{n}}+(nt-{\lfloor{nt}\rfloor})\cdot{\frac{x_{{\lfloor{nt}\rfloor}+1}}{\sqrt{n}}}\right)\
$$
아래 그림은 $W_n(t)$ 그래프의 일부입니다. $n$이 커질수록 두 시점 사이의 간격 $1\over{n}$은 작아집니다. 그래서 ${\lfloor{nt}\rfloor}$가 $nt$에 근접하는 것을 볼 수 있습니다. $n$이 무한히 커지면 이 두 값의 차이가 없다고 보아도 무방할 겁니다.
따라서 $W_t$는 아래와 같이 간단히 정리할 수 있습니다. 여기서 $\frac{S_k}{\sqrt{k}}$는 중심 극한 정리에 따라 $k$가 충분히 크면 표준 정규 확률 변수가 된다고 했으니 무한대에서도 당연히 그렇게 될 겁니다.
$$\begin{aligned}
W_t&=\displaystyle\lim_{n\rightarrow\infty}\frac{S_{nt}}{\sqrt{n}}\\
&=\displaystyle\lim_{n\rightarrow\infty}\left(\frac{S_{nt}}{\sqrt{nt}}\cdot\sqrt{t}\right)\\
&=\sqrt{t}\cdot\displaystyle\lim_{k\rightarrow\infty}\frac{S_k}{\sqrt{k}}\quad\because nt=k\\
&=\sqrt{t}\cdot z\quad\because z=\displaystyle\lim_{k\rightarrow\infty}\frac{S_k}{\sqrt{k}} \sim N(0,1)
\end{aligned}$$
따라서 $W_t$의 평균과 분산은 각각 0과 t이고 확률 분포는 정규 분포가 됩니다.
$$\begin{aligned}
E(W_t)&=\sqrt{t}\cdot E(z)=0\quad\because E(z)=0\\
Var(W_t)&=t\cdot Var(z)=t\quad\because Var(z)=1\\
\end{aligned}$$
$$\therefore W_t \sim N(0,t)
$$
$W_t$는 $t=1$ 시점에서 뿐만 아니라 언제나 정규 분포를 따를다는 것을 알게 되었습니다. 중심 극한 정리는 확률 변수 뿐만이 아니라 확률 과정에도 적용이 되는 것입니다. 시간이 지날수록 $W_t$의 분산이 커지므로 - 시간 $t$가 곧 분산이므로 - 확률 밀도 함수를 그려 보면 시간이 흘러 갈수록 봉우리는 점점 낮아지고 폭은 점점 넓어지게 됩니다.
불변성 원리
무작위 보행은 본질적으로 동전 던지기입니다. 그리고 중심 극한 정리에 따라 정규 분포를 따르게 됩니다. 그런데 중심 극한 정리는 모집단의 분포와는 무관하게 성립하므로 꼭 동전 던지기가 아니어도 됩니다. 평균과 분산이 동전 던지기와 동일한 확률 변수이기만 하면 됩니다.
동전 던지기 확률 변수 $x$의 평균과 분산은 각각 0과 1입니다. 따라서 이와 평균과 분산이 같은 표준 정규 확률 변수를 사용해도 됩니다. 확률 변수 $x$가 어떤 분포를 따르든지 평균이 0이고 분산이 1이면 무작위 보행 함수의 극한이 확률 과정 $W_t$로 수렴하는 것은 변함이 없는데 이를 불변성 원리(invariance principle)
라고 합니다.
동전을 던지는 대신에 표준 정규 분포를 따르는 난수를 생성하여 무작위 보행 함수의 그래프를 다시 그려 보면 다음과 같습니다. 훨씬 자연스럽게 보입니다.
위너 과정
무작위 보행 함수의 극한이 수렴하는 확률 과정 $W_t$를 위너 과정(Wiener process)
이라고 합니다. 위너 과정은 브라운 운동(Brownian motion)
이라고도 합니다.
한 시간에 $n$번 동전을 던지니까 시간은(time) $1 \over n$ 시간씩(hour) 증가합니다. 이를 $\Delta t$라고 하면 동전을 한 번 던졌을 때의 위치의 변화량은 이렇게 쓸 수 있습니다.
$$\frac{x}{\sqrt{n}}=x \cdot \sqrt{\Delta t}\quad\because\Delta t=\frac{1}{n}
$$
시간의 관점에서 보자면 무작위 보행은 시간이 $\Delta t$ 단위로 증가하고 그때마다 위치는 $x \cdot \sqrt{\Delta t}$씩 변화하는 확률 과정입니다. 여기서 동전 던지기 확률 변수 $x$ 대신에 표준 정규 확률 변수 $\epsilon$을 사용하고, $n$을 무한대로 보내 버리면 - $\Delta t$를 0으로 보내 버리면 - 위너 과정이 됩니다.
$$\Delta W_n(t)=x \cdot \sqrt{\Delta t}\quad\text{(Random walk)}
$$
$$dW_t=\epsilon \cdot \sqrt{dt}\quad\text{(Wiener process)}
$$
'Workshop' 카테고리의 다른 글
옵션 가격 모형 #2 - 1 기간 이항 모형 (1) | 2025.02.27 |
---|---|
옵션 가격 모형 #1 - 이항 분포 (0) | 2025.02.27 |
주가의 움직임 #4 - 기하 브라운 운동 (0) | 2025.02.15 |
주가의 움직임 #3 - 산술 브라운 운동 (0) | 2025.02.10 |
주가의 움직임 #1 - 무작위 보행 (1) | 2025.02.06 |