[SDE] 2.3 Exercises (Part 1)
책 2장의 연습문제 풀이 (Part 1) 문제 2.1 ~ 2.4
- [SDE] 1. Introduction
- [SDE] 2.1 확률론의 기초 언어 (Part 1): 공간, 변수, 그리고 기댓값과 독립성
- [SDE] 2.1 확률론의 기초 언어 (Part 2): 확률 과정과 Kolmogorov Extension Theorem
- [SDE] 2.2 An Important Example: Brownian Motion (브라운 운동)
- [SDE] 기초개념: 지시 함수(indicator function)
- [SDE] 2.3 Exercises (Part 2)
- [SDE] 2.3 Exercises (Part 3)
- [SDE] 2.3 Exercises (Part 4)
시작에 앞서..
이 포스팅 시리즈는 Diffusion을 공부하다 SDE를 공부해야한다는 생각으로 혼자 책을 읽으며 정리한 글입니다. Bernt Øksendal 교수님의 책 “Stochastic Differential Equations: An Introduction with Applications1“을 참고하여 작성하였습니다.
Ex. 2.1.
2.1
함수 $X : \Omega \rightarrow \mathbb{R}$가 오직 셀 수 있는 값들 $a_1, a_2, \dots \in \mathbb{R}$만을 취한다고 하자.
다음 조건이 성립할 때 그리고 오직 그럴 때에만 (iff) $X$가 확률변수임을 보여라:
\[X^{-1}(a_k) \in \mathcal{F} \qquad \text{for all } k = 1, 2, \dots \tag{2.2.16}\]식 (2.2.16)이 성립한다고 하자. 이때 다음 식이 성립함을 보여라:
\[E \left[ |X| \right] = \sum_{k=1}^{\infty} |a_k| P[X = a_k]. \tag{2.2.17}\]식 (2.2.16)이 성립하고 $E \left[ \lvert X \rvert \right] < \infty$ 라고 하자. 이때 다음을 증명하라:
\[E \left[ X \right] = \sum_{k=1}^{\infty} a_k P[ X = a_k ].\]식 (2.2.16)이 성립한다고 가정하고, $f : \mathbb{R} \rightarrow \mathbb{R}$ 이 measurable이고 bounded라고 하자. 이때 다음이 성립함을 보여라:
\[E \left[ f(X) \right] = \sum_{k=1}^{\infty} f(a_k) P[X = a_k].\]
📂 풀이
2.1.a)
우리가 증명하고자 하는 것은 다음과 같다:
\[\forall k \in \mathbb{N}, X^{-1}(\{a_k\}) \in \mathcal{F} \iff X \text{는 확률 변수}\](컴공인 내 입장에서는 $X^{-1}$의 입력이 $a_k$인 것과 $\{ a_k \}$인 것이 type이 다르므로 다른 것이라고 생각했는데, 확률론에서는 관습적으로 $f(a_k)$를 $f(\{ a_k \})$의 약어로 동일하게 취급해준다고 한다…)
먼저, $\Leftarrow$ 방향부터 증명해보자.
즉, $X$가 확률 변수라면, 각각의 $a_k$에 대해서도 $\mathcal{F}$-measurable 임을 보이는 것이다.
$X$가 확률 변수라고 가정해보자. 그러면 임의의 Borel 집합 $B \in \mathcal{B}(\mathbb{R})$에 대해 $X^{-1}(B) \in \mathcal{F}$ 임을 알 수 있다. (확률 변수의 정의이다.)
그런데, $a_k$를 하나의 원소로 가지는 집합 $\{ a_k \}$는 닫힌 집합이므로 Borel 집합이다. 즉,
\[\{ a_k \} \in \mathcal{B}(\mathbb{R}).\]따라서, $B = \{ a_k \}$로 설정하면, $X^{-1}(B) = X^{-1}(\{ a_k \}) \in \mathcal{F}$ 임을 알 수 있다.
(증명 끝)
다음으로, $\Rightarrow$ 방향을 증명해보자.
즉, 각각의 $a_k$에 대해서 $X$가 $\mathcal{F}$-measurable이면, $X$가 확률 변수임을 보이는 것이다.
$X$가 취할 수 있는 값은 오직 $S = \{ a_1, a_2, \dots \}$ 뿐이다. 따라서 어떤 집합 $B$에 대한 역상은 $B$ 안에 들어있는 $a_k$들의 역상들의 합과 같다. 즉
\[\begin{aligned} X^{-1}(B) &= \{ \omega \in \Omega : X(\omega) \in B\} \\ &= \{ \omega \in \Omega : X(\omega) \in S \cap B\} \quad (\because X(\omega) \text{는 무조건 } S \text{에 속함}) \\ &= \{ \omega \in \Omega : X(\omega) \in \{ a_k : a_k \in B \} \} \\ &= \bigcup_{a_k \in B} X^{-1}(\{ a_k \}). \end{aligned}\]우리는 식 (2.2.16)이 성립한다고 가정하므로, 각각의 $X^{-1}(\{ a_k \})$는 $\mathcal{F}$에 속한다.
$\sigma$-algebra ($\mathcal{F}$)의 정의에 의해, measurable 집합들의 합집합은 여전히 measurable 집합이므로, $\bigcup_{a_k \in B} X^{-1}(\{ a_k \}) \in \mathcal{F}$ 이다.
따라서, $X^{-1}(B) \in \mathcal{F}$ 임을 알 수 있다. 즉, $X$는 확률 변수이다.
(증명 끝)
2.1.b)
우리가 책의 앞 내용에서 배운 것은 적분으로 표현된 기댓값의 정의이다:
\[E \left[ |X| \right] = \int_{\Omega} |X(\omega)| dP(\omega).\]그리고 우리가 증명하고자 하는 것은 다음과 같다:
\[E \left[ |X| \right] = \sum_{k=1}^{\infty} |a_k| P[X = a_k].\]이제 우리는 이 연속된 적분을 이산화된 합($\sum$)으로 표현해야 한다. 이제 이 문제를 풀기 위해 지시함수를 도입하자.
먼저 확률변수 $\lvert X \rvert$를 우리가 다루기 쉬운 지시 함수들의 합으로 다시 표현하자. $X$는 이산적인 값 $a_1, a_2, \dots$만을 가지므로, 다음과 같이 쓸 수 있다:
\[|X(\omega)| = \sum_{k=1}^{\infty} |a_k| \mathbf{1}_{A_k}(\omega).\]여기서 $A_k = \{ \omega \in \Omega : X(\omega) = a_k \}$이다. 문제 a)에서 증명한 바에 의해 $A_k \in \mathcal{F}$ 이므로, 이 지시 함수는 well-defined 된 확률 변수이다. 결국, 이 식은 $X$가 $a_k$ 값을 가질 때마다 $\lvert a_k \rvert$를 반환하고, 그렇지 않으면 $0$을 반환한다는 의미이다.
이제, 이 표현을 기댓값의 정의에 대입해보자:
\[\begin{aligned} E \left[ |X| \right] &= \int_{\Omega} |X(\omega)| dP(\omega) \\ &= \int_{\Omega} \left( \sum_{k=1}^{\infty} |a_k| \mathbf{1}_{A_k}(\omega) \right) dP(\omega). \end{aligned}\]적분 안에 무한 급수가 갇혀 있는 형태인데, 이 둘의 순서를 바꾸기 위해서는 단조 수렴 정리(Monotone Convergence Theorem, MCT)를 사용할 수 있다. 이 정리의 핵심은, 피적분 함수들이 음수가 아니고, 합을 더할수록 단조 증가 한다면, $\int$와 $\sum$의 순서를 바꿀 수 있다는 것이다.
우리의 피적분 함수는 다음과 같다:
\[|a_k| \mathbf{1}_{A_k}(\omega) \geq 0.\]절대값 덕분에 음수가 아니고, 모든 항이 음수가 아니므로 값은 더할수록 단조 증가한다. 따라서 MCT를 적용할 수 있다:
\[\begin{aligned} E \left[ |X| \right] &= \int_{\Omega} \left( \sum_{k=1}^{\infty} |a_k| \mathbf{1}_{A_k}(\omega) \right) dP(\omega) \\ &= \sum_{k=1}^{\infty} \int_{\Omega} |a_k| \mathbf{1}_{A_k}(\omega) dP(\omega) \\ &= \sum_{k=1}^{\infty} |a_k| \int_{\Omega} \mathbf{1}_{A_k}(\omega) dP(\omega). \end{aligned}\]$\lvert a_k \rvert$는 상수이기 때문에 적분 밖으로 꺼낼 수 있었고, 결국 우리는 $\int \mathbf{1}_{A_k} dP$ 형태의 적분만 남았는데, 이는 지시 함수의 성질에 따라 집합 $A_k$의 확률과 같다:
\[\int_{\Omega} \mathbf{1}_{A_k}(\omega) dP(\omega) = P(A_k) = P[X = a_k].\]따라서 최종적으로 다음을 얻는다:
\[E \left[ |X| \right] = \sum_{k=1}^{\infty} |a_k| P[X = a_k].\](증명 끝)
2.1.c)
b)에서 증명한 것과 같은데, 차이점은 이번에는 절대값이 없다는 것이다. 이런… 이번에는 $X$가 음수일 수도 있기 때문에 MCT를 사용하지 못한다. 이 문제를 풀기 위한 우리의 전략은 $X$를 양수 부분과 음수 부분으로 나눠서, 각각에 대해 b)를 적용하고, 그 결과를 다시 합치는 것이다. 수학적으로 엄밀하게 증명해 보자.
우리가 증명하고자 하는 것은 다음과 같다:
\[E \left[ X \right] = \sum_{k=1}^{\infty} a_k P[ X = a_k ].\]여기서 $X$는 양수와 음수 부분으로 분해 가능하다
\[X(\omega) = X^+(\omega) - X^-(\omega),\]여기서 정의는 다음과 같다.
- $X^+(\omega) = \max(X(\omega), 0)$ (0보다 크면 그 값, 아니면 0)
- $X^-(\omega) = \max(-X(\omega), 0)$ (음수일 때는 부호를 떼고, 양수일 때는 0) 이렇게 정의하면, $X^+$와 $X^-$는 모두 음수가 아니므로 MCT를 적용할 수 있다.
문제 조건에서 $E[\lvert X \rvert] < \infty$ 라고 했다. $\lvert X \rvert = X^+ + X^-$이므로 다음이 성립한다.
\[E[|X|] = E[X^+] + E[X^-] < \infty.\]따라서, $E[X^+]$도 유한하고, $E[X^-]$도 유한하는 뜻이다. 즉 $\infty - \infty$ 꼴의 부정형이 발생하지 않으므로, 우리는 적분의 선형성을 이용할 수 있다.
\[\begin{aligned} E[X] &= \int_{\Omega} X(\omega) dP(\omega) \\ &= \int_{\Omega} \left( X^+(\omega) - X^-(\omega) \right) dP(\omega) \\ &= \int_{\Omega} X^+(\omega) dP(\omega) - \int_{\Omega} X^-(\omega) dP(\omega) \\ &= E[X^+] - E[X^-]. \end{aligned}\]$X^+$와 $X^-$는 모두 음수가 아니므로, b)에서 증명한 결과를 각각 적용할 수 있다.
양수 부분 ($X^+$): $a_k > 0$인 항들만 살아남는다.
\[E[X^+] = \sum_{k: a_k > 0} a_k P[X = a_k],\](어짜피 $a_k \leq 0$인 경우 $X^+$ 값은 0이므로, 합에 기여하지 않는다.)
음수 부분 ($X^-$): $a_k < 0$인 항들만 살아남는데, 값은 양수이므로 부호가 바뀐다.
\[E[X^-] = \sum_{k: a_k < 0} (-a_k) P[X = a_k].\]
따라서, 이들을 다시 합치면,
\[\begin{aligned} E[X] &= E[X^+] - E[X^-] \\ &= \sum_{a_k \geq 0} a_k P[X = a_k] - \sum_{a_k < 0} (-a_k) P[X = a_k] \\ &= \sum_{a_k \geq 0} a_k P[X = a_k] + \sum_{a_k < 0} a_k P[X = a_k] \\ &= \sum_{k=1}^{\infty} a_k P[X = a_k]. \end{aligned}\](증명 끝)
2.1.d)
마지막으로 우리가 증명해야 할 식은 다음과 같다. 이번에는 $X$에 함수 $f$가 씌워진 형태이다:
\[E\left[ f(X) \right] = \sum_{k=1}^{\infty} f(a_k) P[X = a_k].\]여기서 함수 $f : \mathbb{R} \rightarrow \mathbb{R}$는 Borel measurable하고 유계(bounded)하다는 조건이 주어졌다.
먼저, b)에서 한 것처럼 $f(X)$를 지시 함수들의 합으로 표현해 보자. $X(\omega)$가 $a_k$ 값을 가지면, 합성된 확률 변수 $f(X(\omega))$는 $f(a_k)$ 값을 가지므로 다음과 같이 쓸 수 있다:
\[f(X(\omega)) = \sum_{k=1}^{\infty} f(a_k) \mathbf{1}_{A_k}(\omega),\]이제 이 식을 기댓값의 정의(적분)에 대입한다:
\[\begin{aligned} E\left[ f(X) \right] &= \int_{\Omega} f(X(\omega)) dP(\omega) \\ &= \int_{\Omega} \left( \sum_{k=1}^{\infty} f(a_k) \mathbf{1}_{A_k}(\omega) \right) dP(\omega). \end{aligned}\]여기까지는 b)에서 한 것과 동일하다. c)에서 우리가 부딪힌 문제와 같이 $f(a_k)$가 음수가 될 수도 있기 때문에 MCT를 바로 적용할 수 없다. c)에서 푼 것처럼 $f$를 분해할 수도 있지만, 문제에서 $f$가 유계 함수라고 했으므로, 우리는 지배 수렴 정리(Dominated Convergence Theorem, DCT) 를 사용할 수 있다. 이 정리의 핵심은, 피적분 함수들이 어떤 적분 가능한 함수에 의해 절대값이 유계(지배)될 수 있다면, $\int$와 $\sum$의 순서를 바꿀 수 있다는 것이다. 우리의 피적분 함수는 $f$이고, 어떤 적분 가능한 함수 $g=M$으로 설정하면 우리는 DCT를 적용할 수 있다.
\[\begin{aligned} E\left[ f(X) \right] &= \int_{\Omega} \left( \sum_{k=1}^{\infty} f(a_k) \mathbf{1}_{A_k}(\omega) \right) dP(\omega) \\ &= \sum_{k=1}^{\infty} \int_{\Omega} f(a_k) \mathbf{1}_{A_k}(\omega) dP(\omega) \\ &= \sum_{k=1}^{\infty} f(a_k) \int_{\Omega} \mathbf{1}_{A_k}(\omega) dP(\omega) \\ &= \sum_{k=1}^{\infty} f(a_k) P[X = a_k]. \end{aligned}\]따라서, 우리가 원하는 식이 성립함을 보였다.
(증명 끝)
Ex. 2.2.
2.2
$X : \Omega \rightarrow \mathbb{R}$가 확률변수라고 하자. $X$의 분포함수(distribution function) $F$는 다음과 같이 정의된다:
\[F(x) = P[X \le x].\]
$F$가 다음 성질들을 만족함을 보여라:
\[F(x) = \lim_{h \rightarrow 0^+} F(x + h).\]
$0 \le F(x) \le 1,\quad \lim_{x \to -\infty} F(x) = 0,\quad \lim_{x \to \infty} F(x) = 1.$
$F$는 증가함수(increasing, 즉 non-decreasing)이다.
$F$는 우연속(right-continuous)이다. 즉,
$g : \mathbb{R} \rightarrow \mathbb{R}$가 measurable이고 $E[\lvert g(X) \rvert] < \infty$라고 하자. 이때 다음을 증명하라:
\[E[g(X)] = \int_{-\infty}^{\infty} g(x)\, dF(x),\]여기서 우변의 적분은 Lebesgue–Stieltjes 적분 의미로 해석한다.
$p(x) \ge 0$인 measurable 함수라고 하자. $X$가 밀도(density) $p$를 가진다는 것은 다음이 성립함을 의미한다:
\[F(x) = \int_{-\infty}^{x} p(y)\, dy \quad \text{for all } x.\](2.2.1)–(2.2.2)로부터, 1차원 Brownian motion $B_t$가 $B_0 = 0$일 때 시간 $t$에서 $B_t$의 밀도는 다음과 같다:
\[p(x) = \frac{1}{\sqrt{2\pi t}} \exp\left( -\frac{x^2}{2t} \right), \qquad x \in \mathbb{R}.\]$B_t^2$의 밀도를 구하라.
📂 풀이
2.2.a)
먼저 (i)를 증명하자
$0 \leq F(x) \leq 1$은 확률 측도 $P$의 정의($P : \mathcal{F} \rightarrow [0, 1]$)에 의해 자명하다.
단조 증가하여 $\infty$로 발산하는 수열 $x_n \to \infty$를 생각해보자(e.g. $x_n = n$), 그리고 사건 $A_n = \{ \omega \in \Omega : X(\omega) \leq x_n \}$를 정의하자.
\[\begin{aligned} \lim_{n \to \infty} A_n &= \lim_{n \to \infty} \{ \omega \in \Omega : X(\omega) \leq x_n \} \\ &= \{ \omega \in \Omega : X(\omega) < \infty \} \\ &= \Omega, \end{aligned}\]따라서,
\[\begin{aligned} \lim_{x \to \infty} F(x) &= \lim_{n \to \infty} P[X \leq x_n] \\ &= P\left( \lim_{n \to \infty} \{ X \leq x_n \} \right) \\ &= P(\lim_{n \to \infty} A_n) \\ &= P(\Omega) = 1. \end{aligned}\]이번에는 단조 감소하여 $-\infty$로 발산하는 수열 $y_n \to -\infty$를 생각해보자(e.g. $y_n = -n$), 그리고 사건 $B_n = \{ \omega \in \Omega : X(\omega) \leq y_n \}$를 정의하자.
\[\begin{aligned} \lim_{n \to \infty} B_n &= \lim_{n \to \infty} \{ \omega \in \Omega : X(\omega) \leq y_n \} \\ &= \{ \omega \in \Omega : X(\omega) < -\infty \} \\ &= \varnothing, \end{aligned}\]따라서,
\[\begin{aligned} \lim_{x \to -\infty} F(x) &= \lim_{n \to \infty} P[X \leq y_n] \\ &= P\left( \lim_{n \to \infty} \{ X \leq y_n \} \right) \\ &= P(\lim_{n \to \infty} B_n) \\ &= P(\varnothing) = 0. \end{aligned}\]다음으로 (ii)를 증명하자
$F$가 증가 함수임을 보이기 위해, 임의의 $x_1 < x_2$에 대해 $F(x_1) \leq F(x_2)$임을 보이면 된다.
$x_1 < x_2$일 때, 사건 $C_1 = \{ \omega \in \Omega : X(\omega) \leq x_1 \}$와 $C_2 = \{ \omega \in \Omega : X(\omega) \leq x_2 \}$를 정의하자. 자연스럽게 $C_1 \subseteq C_2$임을 알 수 있다. 따라서, 확률 측도 $P$의 단조성에 의해, $P(C_1) \leq P(C_2)$이다. 즉,
\[F(x_1) = P(C_1) \leq P(C_2) = F(x_2).\]마지막으로 (iii)를 증명하자
$F$가 우연속임을 보이기 위해, 임의의 $x \in \mathbb{R}$에 대해 $F(x) = \lim_{h \to 0^+} F(x + h)$임을 보이면 된다.
사건 $D_h = \{ \omega \in \Omega : X(\omega) \leq x + h \}$과 사건 $D = \{ \omega \in \Omega : X(\omega) \leq x \}$를 정의하자. 그리고 사건 $H = D_h \setminus D = \{ \omega \in \Omega : x < X(\omega) \leq x + h \}$를 생각해보자.
\[\begin{aligned} F(x + h) - F(x) &= P(D_h) - P(D) \\ &= P(D_h \setminus D) \\ &= P(H). \end{aligned}\]이다. 이제 $\lim_{h \to 0^+}$를 양 변에 취하면,
\[\begin{aligned} \lim_{h \to 0^+} [F(x + h) - F(x)] &= \lim_{h \to 0^+} P(H) \\ &= P\left( \lim_{h \to 0^+} H \right) \\ &= P(\{ \omega \in \Omega : x < X(\omega) \leq x \}) \\ &= 0. \end{aligned}\]따라서 $F(x) = \lim_{h \to 0^+} F(x + h)$ 임을 알 수 있다.
(증명 끝)
2.2.b)
우리는 기댓값의 정의(LOTUS)에 의해 다음을 알고 있다.
\[E[g(X)] = \int_{\Omega} g(X(\omega)) \, dP(\omega) = \int_{\mathbb{R}} g(x) \, d\mu_X(x).\]여기서 확률 측도 $\mu_X$는 $X$에 의해 유도된 분포(induced measure)로, 임의의 Borel 집합 $B$에 대해 $\mu_X(B) = P(X \in B)$이다.
한편, 분포함수 $F(x)$의 정의를 살펴보면:
\[\begin{aligned} F(x) &= P(X \leq x) \\ &= P(X \in (-\infty, x]) \\ &= \mu_X((-\infty, x]). \end{aligned}\]즉, 반열린 구간(semi-open interval) $I = (-\infty, x]$에 대해서, 분포함수 $F$가 정의하는 측도 $\mu_F$와 유도된 측도 $\mu_X$가 일치함을 알 수 있다.
측도론의 유일성 정리(Uniqueness Theorem)에 의해, 생성원(generator)인 구간들 위에서 일치하는 두 측도는 모든 Borel 집합 위에서 동일하다. 즉, $\mu_X = \mu_F$이다.
따라서, 이 측도에 대한 적분인 Lebesgue-Stieltjes 적분과 기댓값은 일치한다.
\[E[g(X)] = \int_{\mathbb{R}} g(x) \, d\mu_X(x) = \int_{-\infty}^{\infty} g(x) \, dF(x).\](증명 끝)
2.2.c)
문제에서 말하는 식 (2.2.1)–(2.2.2)는 다음과 같다:
\[\nu_{t_1, \dots, t_k} (F_1 \times \cdots \times F_k) \\ = \int_{F_1 \times \cdots \times F_k} \underbrace{p(t_1, x, x_1)}_{\text{Step 1}} \cdot \underbrace{p(t_2 - t_1, x_1, x_2)}_{\text{Step 2}} \cdots \underbrace{p(t_k-t_{k-1}, x_{k-1}, x_k)}_{\text{Step k}} d x_1 \cdots d x_k \tag{2.2.1}\] \[P^x (B_{t_1} \in F_1, \cdots, B_{t_k} \in F_k) = \int_{F_1 \times \cdots \times F_k} p(t_1, x, x_1) \cdot p(t_2 - t_1, x_1, x_2) \cdots p(t_k - t_{k-1}, x_{k-1}, x_k) d x_1 \cdots d x_k \tag{2.2.2}\]우리는 새로운 확률 변수 $Y = B_t^2$의 확률밀도함수(PDF)를 구해야 한다. 문제에서 주어진 $F(x) = \int_{-\infty}^{x} p(y) \, dy$의 정의에 따라, 밀도함수 $p(x)$는 분포함수 $F(x)$의 미분으로 구할 수 있다는 것을 알 수 있다:
\[p(x) = \frac{d}{dx} F(x).\]문제에서 언급한 식 (2.2.2)에서 $k=1$이고 $x=0$ (시작점)인 경우를 생각해보자.
\[P(B_t \in F) = \int_{F} p(t, 0, y) \, dy\]이는 $B_t$가 평균이 0이고 분산이 $t$인 정규분포 $N(0, t)$를 따른다는 것을 의미한다. 즉, $B_t$의 밀도함수 $f_X(x)$는 다음과 같다.
\[f_X(x) = \frac{1}{\sqrt{2\pi t}} \exp\left( -\frac{x^2}{2t} \right).\]이제 $Y = B_t^2$의 밀도함수 $f_Y(y)$를 구하기 위해, 먼저 $Y$의 분포함수(CDF) $F_Y(y)$를 구하고 이를 미분하는 방식을 사용하자.
$Y = B_t^2$이므로 $Y$는 항상 0보다 크거나 같다. 따라서 $y < 0$일 때 $F_Y(y) = 0$이다. $y \ge 0$일 때,
\[\begin{aligned} F_Y(y) &= P[Y \le y] \\ &= P[B_t^2 \le y] \\ &= P[-\sqrt{y} \le B_t \le \sqrt{y}]. \end{aligned}\]$B_t$의 밀도함수는 $y$축에 대칭인 우함수(Even function)이므로, 적분 구간을 $[0, \sqrt{y}]$로 좁히고 2배를 할 수 있다.
\[\begin{aligned} F_Y(y) &= \int_{-\sqrt{y}}^{\sqrt{y}} f_X(x) \, dx \\ &= 2 \int_{0}^{\sqrt{y}} \frac{1}{\sqrt{2\pi t}} \exp\left( -\frac{x^2}{2t} \right) \, dx. \end{aligned}\]밀도함수의 정의에 의해 $f_Y(y) = \frac{d}{dy} F_Y(y)$이다. 라이프니츠 적분 규칙(Leibniz Integral Rule)과 체인 룰(Chain Rule)을 적용하여 미분하자.
\[\begin{aligned} f_Y(y) &= \frac{d}{dy} \left( 2 \int_{0}^{\sqrt{y}} \frac{1}{\sqrt{2\pi t}} \exp\left( -\frac{x^2}{2t} \right) \, dx \right) \\ &= 2 \cdot \underbrace{\frac{1}{\sqrt{2\pi t}} \exp\left( -\frac{(\sqrt{y})^2}{2t} \right)}_{f_X(\sqrt{y})} \cdot \underbrace{\frac{d}{dy}(\sqrt{y})}_{\text{Chain rule}}. \end{aligned}\]여기서 $\frac{d}{dy}(\sqrt{y}) = \frac{1}{2\sqrt{y}}$ 이므로,
\[\begin{aligned} f_Y(y) &= 2 \cdot \frac{1}{\sqrt{2\pi t}} e^{-\frac{y}{2t}} \cdot \frac{1}{2\sqrt{y}} \\ &= \frac{1}{\sqrt{2\pi t} \sqrt{y}} e^{-\frac{y}{2t}} \\ &= \frac{1}{\sqrt{2\pi t y}} \exp\left( -\frac{y}{2t} \right) \quad (y > 0). \end{aligned}\]따라서 $B_t^2$의 밀도함수는 다음과 같다.
\[p_{B_t^2}(y) = \begin{cases} \frac{1}{\sqrt{2\pi t y}} e^{-y/2t} & y > 0 \\ 0 & y \le 0 \end{cases}\](풀이 끝)
Ex. 2.3.
2.3
$\Omega$ 위의 $\sigma$-algebra들의 집합 \(\{ \mathcal{H}_i \}_{i \in I}\)이 주어졌을 때, 다음의 식이 다시 $\sigma$-algebra임을 보여라:
\[\mathcal{H} = \bigcap \{ \mathcal{H}_i; i \in I \}\]
📂 풀이
우리는 $\mathcal{H} = \bigcap_{i \in I} \mathcal{H}_i$가 $\sigma$-algebra의 세 가지 정의를 만족하는지 차례대로 확인하면 된다.
1. 공집합의 포함 여부 ($\varnothing \in \mathcal{H}$)
$\sigma$-algebra의 정의에 의해, 모든 $i \in I$에 대하여 $\varnothing \in \mathcal{H}_i$이다. 모든 집합이 공집합을 원소로 가지고 있으므로, 그들의 교집합에도 당연히 공집합이 포함된다.
\[\forall i \in I, \varnothing \in \mathcal{H}_i \implies \varnothing \in \bigcap_{i \in I} \mathcal{H}_i = \mathcal{H}.\]2. 여집합에 대해 닫혀 있는가? (Closed under complement)
임의의 집합 $A \in \mathcal{H}$를 뽑았다고 하자. 교집합의 정의에 의해, $A$는 모든 $\mathcal{H}_i$에 동시에 속해 있어야 한다. 즉, 모든 $i \in I$에 대해 $A \in \mathcal{H}_i$이다.
각각의 $\mathcal{H}_i$는 $\sigma$-algebra이므로 여집합에 대해 닫혀 있다. 따라서 모든 $i$에 대해 $A^c \in \mathcal{H}_i$가 성립한다. 모든 $i$에 대해 성립하므로, $A^c$는 교집합 $\mathcal{H}$에도 속한다.
\[A \in \mathcal{H} \implies \forall i \in I, A \in \mathcal{H}_i \implies \forall i \in I, A^c \in \mathcal{H}_i \implies A^c \in \mathcal{H}.\]3. 가산 합집합에 대해 닫혀 있는가? (Closed under countable unions)
$\mathcal{H}$에서 가산 개의 원소들 $A_1, A_2, \dots$를 뽑았다고 하자. ($A_n \in \mathcal{H}$) 교집합의 정의에 의해, 모든 $n$과 모든 $i$에 대해 $A_n \in \mathcal{H}_i$이다.
이제 특정 $i$를 고정해서 보자. $\mathcal{H}_i$는 $\sigma$-algebra이므로 가산 합집합에 대해 닫혀 있다.
\[\bigcup_{n=1}^{\infty} A_n \in \mathcal{H}_i\]이 사실이 모든 $i \in I$에 대해 성립하므로, 이 합집합은 교집합 $\mathcal{H}$에도 속하게 된다.
\[\forall i \in I, \bigcup_{n=1}^{\infty} A_n \in \mathcal{H}_i \implies \bigcup_{n=1}^{\infty} A_n \in \mathcal{H}.\]결론: 위 1, 2, 3번에 의해 $\mathcal{H}$는 $\sigma$-algebra의 모든 조건을 만족한다.
(증명 끝)
Ex. 2.4.
2.4
$X : \Omega \rightarrow \mathbb{R}^n$는 다음을 만족하는 확률 변수라고 하자.
\[E \left[ \lvert X \rvert ^p \right] < \infty \qquad \text{for some }p, \; 0 < p < \infty.\]이때, 다음의 chebychev 부등식이 성립함을 보여라:
\[P \left[ \lvert X \rvert \ge \lambda \right] \le \frac{1}{\lambda^p} E \left[ \lvert X \rvert ^p \right], \qquad \text{for all } \lambda \geq 0.\]힌트: $ \int_\Omega \lvert X \rvert^p dP \geq \int_A \lvert X \rvert^p dP $, 여기서 $A = \{ \omega : \; \lvert X \rvert \geq \lambda \} $.
어떤 $k > 0$에 대해 다음이 성립한다고 하자:
\[M = E\left[ \exp ( k \lvert X \rvert ) \right] < \infty.\]이때, 다음 부등식이 성립함을 보여라:
\[P \left[ \lvert X \rvert \geq \lambda \right] \leq M e^{-k \lambda}, \qquad \text{for all } \lambda \geq 0.\]
📂 풀이
2.4.a)
사건 $A = \{ \omega : \lvert X(\omega) \rvert \geq \lambda \}$라고 정의하자. 기댓값 $E[\lvert X \rvert^p]$는 전체 공간 $\Omega$에 대한 적분이다. 적분 구간을 $A$로 좁히면, 피적분 함수 $\lvert X \rvert^p$가 양수이므로 값은 작아지거나 같아진다. 주어진 힌트를 활용하면:
\[\begin{aligned} E[\lvert X \rvert^p] &= \int_{\Omega} \lvert X \rvert^p \, dP \\ &\geq \int_{A} \lvert X \rvert^p \, dP. \end{aligned}\]집합 $A$ 위에서는 정의상 $\lvert X \rvert \geq \lambda$가 성립한다. $p > 0$이므로 양변을 $p$승 해도 부등호 방향은 유지된다. 즉, $A$ 위에서 $\lvert X \rvert^p \geq \lambda^p$ 이다.
\[\begin{aligned} \int_{A} \lvert X \rvert^p \, dP &\geq \int_{A} \lambda^p \, dP \\ &= \lambda^p \int_{A} 1 \, dP \\ &= \lambda^p P(A). \end{aligned}\]여기서 $\lambda^p$는 상수이므로 적분 밖으로 나올 수 있었고, $1$을 사건 $A$에 대해 적분하면 $P(A)$가 된다. 지금까지의 부등식을 연결하면 다음과 같다.
\[E[\lvert X \rvert^p] \geq \lambda^p P(A) = \lambda^p P(\lvert X \rvert \geq \lambda).\]양변을 $\lambda^p$로 나누면 증명하고자 하는 식이 완성된다.
\[P(\lvert X \rvert \geq \lambda) \leq \frac{1}{\lambda^p} E[\lvert X \rvert^p].\](증명 끝)
2.4.b)
이 문제는 a)번에서 증명한 부등식을 응용하면 된다. 우리가 구하고 싶은 확률은 $P(\lvert X \rvert \geq \lambda)$ 이다.
부등식 양변에 양수 $k$를 곱하고, 지수 함수(exponential function)를 취해보자. 지수 함수 $e^x$는 단조 증가 함수이므로, 부등호 방향은 바뀌지 않는다.
\[\{ \lvert X \rvert \geq \lambda \} \iff \{ k \lvert X \rvert \geq k \lambda \} \iff \{ e^{k \lvert X \rvert} \geq e^{k \lambda} \}.\]즉, 두 사건은 완전히 동일한 사건이다. 따라서 확률도 같다.
\[P(\lvert X \rvert \geq \lambda) = P\left( e^{k \lvert X \rvert} \geq e^{k \lambda} \right).\]이제 새로운 확률 변수 $Y = e^{k \lvert X \rvert}$라고 생각하고, 1번의 체비쇼프 부등식($p=1$인 경우)을 적용하자. (여기서 기준값은 $\lambda$ 대신 $e^{k \lambda}$가 된다.)
\[\begin{aligned} P\left( Y \geq e^{k \lambda} \right) &\leq \frac{1}{e^{k \lambda}} E[Y] \\ &= e^{-k \lambda} E\left[ e^{k \lvert X \rvert} \right]. \end{aligned}\]문제의 조건에서 $E[e^{k \lvert X \rvert}] = M$ 이라고 하였으므로, 이를 대입하면 원하는 결과를 얻는다.
\[P(\lvert X \rvert \geq \lambda) \leq M e^{-k \lambda}.\](증명 끝)
Reference
Bernt Øksendal, Stochastic Differential Equations, Springer, 2003. DOI: 10.1007/978-3-642-14394-6. ↩︎