[SDE] 기초개념: 지시 함수(indicator function)
지시 함수의 정의와 성질에 대해 설명
- [SDE] 1. Introduction
- [SDE] 2.1 확률론의 기초 언어 (Part 1): 공간, 변수, 그리고 기댓값과 독립성
- [SDE] 2.1 확률론의 기초 언어 (Part 2): 확률 과정과 Kolmogorov Extension Theorem
- [SDE] 2.2 An Important Example: Brownian Motion (브라운 운동)
- [SDE] 2.3 Exercises (Part 1)
- [SDE] 2.3 Exercises (Part 2)
- [SDE] 2.3 Exercises (Part 3)
- [SDE] 2.3 Exercises (Part 4)
확률미분방정식(SDE)이나 측도론(Measure Theory) 기반의 확률론을 공부할 때 가장 먼저 마주하는 개념 중 하나가 바로 지시 함수(Indicator Function)이다. 나 같은 경우는 SDE 책 2장 연습문제 1번을 풀면서 처음 접하게 되었다.
처음 접할 때는 단순히 “0 아니면 1인 함수” 정도로 가볍게 여기기 쉽지만, 사실 이 함수는 르베그 적분(Lebesgue Integration)을 구성하는 가장 기초적인 벽돌(Building block)이다.
처음에는 디락 델타 함수(Dirac Delta Function)랑 비슷한 건가? 싶은 생각이 있어서, 더 찾아보게 되었다. 이 글에서는 지시 함수의 정의와 성질을 정리하고, 물리학이나 공학적 직관을 위해 찾아보면서 정리한 디락 델타 함수와의 관계도 함께 살펴본다.
1. 정의
확률 공간 $(\Omega, \mathcal{F}, P)$가 주어졌을 때, 사건 $A \in \mathcal{F}$에 대한 지시 함수 $\mathbf{1}_A : \Omega \rightarrow \mathbb{R}$는 다음과 같이 정의한다.
\[\mathbf{1}_A(\omega) := \begin{cases} 1, & \text{if } \omega \in A \\ 0, & \text{if } \omega \notin A \end{cases}\]문헌에 따라 $I_A(\omega)$ 또는 $\chi_A(\omega)$로 표기하기도 한다. (확률론 분야에서는 대부분 $\mathbf{1}_A$ 표기를 선호하는 것 같다.) 입력값 $\omega$가 집합 $A$ 안에 “있으면 1, 없으면 0”을 가리키는 스위치(Switch) 역할을 하는 함수다.
항상 그렇지만, 설명만 들으면 이해하기 힘드니까 예시를 들어보자.
예시 1: 알려진 집합들
먼저, $ \mathbb{N} $이나 $\mathbb{R}$ 같은 잘 알려진 집합에 대한 지시 함수를 생각해보자.
- $\mathbf{1}_{\mathbb{N}}(5) = 1$ 이다.
- $\mathbf{1}_{\mathbb{N}}(0.5) = 0$ 이다.
- $\mathbf{1}_{\mathbb{R}}(0.7) = 1$ 이다.
- $\mathbf{1}_{\mathbb{R}}(1+2i) = 0$ 이다.
예시 2: 확률 공간에서의 사건
이번에는 주사위를 던지는 상황을 가정해 보자. 확률 공간을 $(\Omega, \mathcal{F}, P)$라고 할 때,
- 표본 공간: $\Omega = \{1, 2, 3, 4, 5, 6\}$
- 사건: $A = \{2, 4, 6\}$ (짝수가 나오는 사건) 라고 하자.
- 측도 $P$는 균등 분포로 정의되어 있다고 하자. 즉, $P({k}) = 1/6$ for $k=1,2,\dots,6$.
이 때 지시 함수 $\mathbf{1}_A$는 다음과 같이 동작한다:
- $\mathbf{1}_A(1) = 0$ (1은 짝수가 아니므로)
- $\mathbf{1}_A(2) = 1$ (2는 짝수이므로)
- $\mathbf{1}_A(3) = 0$ (3은 짝수가 아니므로)
- $\mathbf{1}_A(4) = 1$ (4는 짝수이므로)
- $\mathbf{1}_A(5) = 0$ (5는 짝수가 아니므로)
- $\mathbf{1}_A(6) = 1$ (6은 짝수이므로)
예시 3: 실수 구간
전체 공간이 $\Omega = [0, 1]$인 확률 공간을 생각해보자. 사건 $B = [0.2, 0.5]$에 대한 지시 함수 $\mathbf{1}_B$는 다음과 같다:
\[\mathbf{1}_B(x) := \begin{cases} 1, & \text{if } 0.2 \leq x \leq 0.5 \\ 0, & \text{otherwise} \end{cases}\]따라서 이 함수의 개형은 구간 $[0.2, 0.5]$에서 높이 1을 가지는 직사각형 모양이 된다.
2. 주요 성질
지시 함수는 집합의 연산을 대수적인 연산(곱셈, 덧셈)으로 변환하는 강력한 성질을 가진다.
- 거듭제곱 (Idempotence): 0과 1만 가지므로 거듭제곱해도 값은 변하지 않는다. \((\mathbf{1}_A)^2 = \mathbf{1}_A\)
- 교집합 (Intersection): 두 집합에 동시에 속해야만 1이 된다. \(\mathbf{1}_{A \cap B} = \mathbf{1}_A \cdot \mathbf{1}_B\)
- 여집합 (Complement): \(\mathbf{1}_{A^c} = 1 - \mathbf{1}_A\)
- 적분 (Expectation): 가장 중요한 성질이다. 지시 함수의 기댓값(르베그 적분)은 해당 사건의 확률이 된다. \(E[\mathbf{1}_A] = \int_{\Omega} \mathbf{1}_A(\omega) \, dP(\omega) = P(A)\)
3. 지시 함수 vs 디락 델타 함수
공부하면서 지시 함수가 특정 값을 ‘콕 집어낸다(pick out)’는 점에서 디락 델타 함수(Dirac delta function)와 비슷하다는 직관을 가졌었다. 결론부터 말하면, 수학적 정의는 다르지만 ‘역할’ 면에서는 깊은 연관이 있다. 이 둘을 명확히 구분하는 것이 측도론적 확률론을 이해하는 데 도움이 된다.
차이점: 정의되는 공간
- 지시 함수 ($\mathbf{1}_A$): 정의역($\Omega$) 위에서 작동한다. 표본 공간 상의 ‘사건(집합)’에 대해 0 또는 1의 값을 갖는다.
- 디락 델타 ($\delta_a$): 치역($\mathbb{R}$) 위에서 작동한다. 실수 축 위의 ‘점’에 무한대의 밀도(단위 질량)를 부여한다.
연결 고리: 이산 확률 변수의 기댓값
이산 확률 변수 $X$의 기댓값을 계산하는 과정에서 두 개념의 관계가 드러난다. $X$가 $a_1, a_2, \dots$ 라는 값들을 가질 때, $X$는 지시 함수들의 합으로 표현된다.
\[X(\omega) = \sum_{k} a_k \mathbf{1}_{A_k}(\omega) \quad (\text{단, } A_k = \{X=a_k\})\]이를 적분하면 우리가 아는 기댓값 공식이 도출된다.
\[E[X] = \int_{\Omega} \sum a_k \mathbf{1}_{A_k} \, dP = \sum a_k P(A_k)\]이제 시각을 확률 분포(Distribution), 즉 실수 공간 $\mathbb{R}$로 옮겨보자. $X$의 확률 분포 측도(measure) $\mu_X$는 정확히 디락 델타들의 합으로 표현된다.
\[\mu_X(dx) = \sum_{k} P(A_k) \delta_{a_k}(dx)\]요약
결론은 지시 함수는 공간이 무엇이든, 집합이라는 개념만 있으면 어디서든 작동할 수 있다. 하지만, 디락 델타는 미분과 적분이 가능한 공간($\mathbb{R}$)에서 정의된다. 따라서 하는 직관은 비슷해 보일 수 있지만, 서로 다른 영역에서 정의되는 개념이다. 마치 악보 위의 음표와 피아노 건반을 때리는 순간의 타격음과 같은 관계라고 할 수 있겠다. 서로 완전히 다른 개념이지만, 우리가 음악을 들을 때에는 두 개념이 합쳐지는 것과 같다.
4. 마무리
측도론에서 말하는 단순 함수(Simple Function)는 결국 이러한 지시 함수들의 유한 선형 결합($\sum c_i \mathbf{1}_{A_i}$)이다.
우리가 복잡한 확률 변수를 적분할 수 있는 이유는, 이 단순한 지시 함수들을 이용해 임의의 가측 함수를 근사(Approximate)할 수 있기 때문이다. 가장 단순하지만 가장 핵심적인 도구인 셈이다.