Workshop

옵션 가격 모형 #1 - 이항 분포

horust 2025. 2. 27. 18:01

들어가며

이번 포스팅은 "The (Mis)Behavior of Markerts"에 나오는 이야기로 시작할까합니다. 1973년 4월 26일 시카고 상품 거래소(The Chicago Board of Trade)에서 주식 옵션의 거래가 시작되었습니다. 물론 그전에도 주식 옵션은 있었습니다. 장외에서만 거래되다가 처음으로 거래소에서 사고 팔 수 있게 된 것이죠. 이날 거래되었던 옵션 중에는 제록스 주식을 석 달 뒤에 주당 160 달러에 살 수 있는 콜 옵션이 있었다고 합니다. 이 콜 옵션의 가격은 주당 5.5 달러였습니다. 한편 이날 뉴욕 증시에서 제록스의 주가는 149 달러였고 석 달 후에 160 달러를 넘지 못하면서 결국 이 콜 옵션은 행사되지 못했다고 합니다. 5.5 달러를 날린 거죠. 하지만 콜 옵션 대신 주식을 샀던 사람은 5.5 달러가 넘는 손실을 입을 수도 있었습니다. 그런데 5.5 달러가 합리적인 가격이었을까요?

매도자와 매수자가 동의한 가격이기는 하지만 그렇다고 해서 합리적 가격이 되는 것은 아닙니다. 옵션의 합리적 가격을 계산할 수 있게 된 때는 블랙-숄즈(Black-Scholes) 모형이 나오고 나서입니다. 공교롭게도 이 시점은 거래소에서 주식 옵션이 처음으로 거래되었던 날의 불과 몇 달 후였다고 합니다. 이 모형의 인기는 대단했습니다. 옵션 딜러들은 모형에 나오는 난해한 용어를 일상적으로 사용하기 시작했고 텍사스 인스트루먼트는 자사의 최신 계산기가 이 모형을 쉽게 계산할 수 있다는 점을 광고했다고 합니다.

아쉽게도 이 모형은 어려운 수학 지식없이는 이해할 수 없습니다. 그래서 이해하기 쉬운 이항 모형을 먼저 살펴 보겠습니다. 무한의 세계에서는 이항 모형이 블랙-숄즈 모형에 가까워지기 때문입니다. 마치 지난 포스팅에서 위너 과정을 보기 전에 무작위 보행을 먼저 살펴 보았던 것과 같습니다. 이미 인터넷에는 이에 관한 좋은 글들이 있습니다. 그중에서 그레고리 군더슨(Gregory Gundersen)이라는 분이 쓰신 아래 세 개의 글을 이번 포스팅을 통해 옮겨 볼까합니다.


결과가 딱 두 가지 뿐인 시행을 여러번 반복했을 때 둘 중 어느 하나의 결과가 나온 회수는 이항 분포(binomial distribution)를 따르게 됩니다. 쉽게 말하자면 동전을 100번 던졌을 때 앞면이 나온 회수가 이항 분포를 따르는 확률 변수입니다. 뒷면이 나온 회수는 굳이 따질 필요가 없습니다. 결과가 딱 두 가지 뿐이므로 앞면이 나온 회수가 60번이라면 뒷면이 나온 회수는 자동으로 40번 입니다.

확률 질량 함수

동전을 $n$번 던졌을 때 앞면이 나온 회수를 $X$라고 합시다. 그리고 동전을 던져서 앞면이 나올 확률을 $p$라고 합시다. 뒷면이 나올 확률은 자동으로 $q=(1-p)$가 되고요. 제대로 만들어진 동전이라면 $p=\frac{1}{2}$이 되어야 합니다. 이항 분포의 모양을 결정하는 것은 $n$과 $p$가 전부입니다. 그래서 이항 분포는 기호로 이렇게 표현합니다.

$$
X \sim B(n,p)
$$

아래 그림은 동전을 3번 던졌을 때까지 나올 수 있는 모든 경우를 보여 줍니다. 예를 들어 HHT는 앞면이 두 번 뒷면이 한 번 나왔다는 의미입니다.

동전을 세 번 던졌을 때 나올 수 있는 결과

저기까지 가는 경로를 세어 보면 길이 3 갈래라는 것을 알 수 있습니다. 동전을 3번 던졌을 때 앞면이 2번 나오는 경우가 3번이라는 거죠. 길의 갈래 수는 조합(combination)으로 간단히 구할 수 있습니다.

각 결과에 도달하는 길의 개수

그리고 셋 중 어느 한 길을 따라 가게될 확률은 $p^2q^1$로 모두 같습니다.

어떤 한 길을 따라서 각 결과에 도달할 확률

따라서 동전을 3번 던져서 앞면이 2번 나올 확률은 이렇게 됩니다.
$$
P(X=2)={}_3C_2 \cdot p^2q^1
$$

이를 일반화하면 동전을 $n$번 던졌을 때 앞면이 $k$번 나올 확률은 아래와 같은 식이 됩니다.

$$
p(X=k)={}_nC_k \cdot p^k q^{n-k}
$$

이를 $X$에 관한 함수의 꼴로 표현한 것이 이항 분포의 확률 질량 함수입니다.

$$
f(X)={}_nC_X \cdot p^X q^{n-X}
$$

평균과 분산

동전을 한 번 던졌을 때 앞면이 나오는 회수를 $x$라고 하면 그 값은 1 아니면 0입니다.

$$\begin{aligned}
p(x=1)&=p\\
p(x=0)&=q=(1-p)
\end{aligned}$$

$x$의 평균과 분산은 아주 쉽게 구할 수 있습니다.

$$\begin{aligned}
E(x)&=1\cdot p+0\cdot q=p\\
Var(x)&=(1-p)^2\cdot p+(0-p)^2\cdot q=pq
\end{aligned}$$

동전을 $n$번 던져 봅시다. 첫 번째 던졌을 때 $x$의 값을 $x_1$, 두 번째는 $x_2$, ..., $n$번째는 $x_n$이라고 합시다. 그러면 $X$는 이를 모두 더한 값이 됩니다.

$$
X=x_1+x_2+...+x_n
$$

따라서 $X$의 평균은 이렇게 됩니다.
$$\begin{aligned}
E(X)&=E(x_1+x_2+...+x_n)\\
&=E(x_1)+E(x_2)+...+E(x_n)\\
&=np
\end{aligned}$$

동전을 던져서 앞면이 나왔다고 다음에 또 앞면이 나오는 것은 아닙니다. 예전에 어떤 값이 나왔든 앞으로 나올 값과는 아무런 상관이 없습니다. 이를 두고 $x_i$들은 서로 독립이라고 합니다. 따라서 $X$의 분산도 평균과 마찬가지로 $x_i$들의 분산을 모두 더한 값이 됩니다.
$$\begin{aligned}
Var(x)&=Var(x_1+x_2+...+x_n)\\
&=Var(x_1)+Var(x_2)+...+Var(x_n)\\
&=npq
\end{aligned}$$

드므와브르-라플라스 정리

동전을 세, 네 번 던지면 모두 앞면이 나오는 경우가 드물지 않을 겁니다. 하지만 동전을 100번 던져서 모두 앞면이 나오는 경우는 거의 없을 겁니다. 대략 50번 정도 나오는 경우가 많을 것이고 여기서 멀어질수록 점점 드물어질 겁니다. 동전을 던지는 회수 $n$이 커지면 $X$가 정규 분포에 가까워질 것 같다는 생각이 듭니다.

이 생각은 이미 수백년 전에 증명되었고 드므와브르-라플라스 정리(De Moivre–Laplace theorem)라고 불리고 있습니다. 중심 극한 정리의 특수한 경우라고 하네요.

$$
X \sim B(n,p) \xrightarrow{d} X \sim N(np, npq)
$$

엑셀로 직접 확인해 보았습니다. 동전은 30번씩 1,000번을 던졌고 앞면이 나오는 회수를 세어 히스토그램을 그렸습니다. 그리고 그 위에 정규 분포 곡선을 겹쳐 그렸더니 잘 들어 맞습니다.

정규 분포로 수렴하는 이항 분포