사전 확률(Prior Probability)은 특정 사건이 일어나기 전에 그 사건이 발생할 것으로 예상되는 확률을 말합니다. 이는 기존의 지식이나 경험에 기반한 확률입니다. 사전 확률은 베이즈 정리에서 중요한 역할을 하며, 새로운 증거나 정보를 바탕으로 업데이트되는 사후 확률(Posterior Probability)을 계산하는 데 사용됩니다.
사전 확률의 개념
- 초기 가정: 사전 확률은 어떤 사건이 발생하기 전에 이미 알고 있는 정보나 데이터를 바탕으로 설정된 초기 가정입니다.
- 베이즈 정리의 출발점: 베이즈 정리에서 사전 확률은 새로운 증거를 고려하기 전의 초기 확률로 사용됩니다.
예시
의학적 예시
어떤 병에 걸릴 확률을 계산할 때 사전 확률을 사용합니다. 예를 들어, 특정 질병의 사전 확률이 5%라면, 이는 전체 인구 중 5%가 그 질병에 걸릴 것으로 예상된다는 의미입니다.
베이즈 정리에서의 역할
베이즈 정리의 수식은 다음과 같습니다:
[
P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}
]
여기서:
- ( P(A) ): 사건 A의 사전 확률 (Prior Probability)
- ( P(B|A) ): 사건 A가 발생한 경우 사건 B가 발생할 조건부 확률 (Likelihood)
- ( P(B) ): 사건 B가 발생할 전체 확률 (Marginal Likelihood)
- ( P(A|B) ): 사건 B가 발생한 후 사건 A가 발생할 사후 확률 (Posterior Probability)
사전 확률의 중요성
- 초기 가정의 영향: 사전 확률이 높으면 새로운 증거가 추가되더라도 사후 확률이 높게 유지됩니다. 반대로, 사전 확률이 낮으면 새로운 증거가 있어도 사후 확률이 낮게 유지됩니다.
- 업데이트 가능성: 새로운 증거나 데이터를 바탕으로 사전 확률을 수정하여 사후 확률을 계산할 수 있습니다.
시각적 예시
벤다이어그램을 사용하여 사전 확률을 설명할 수 있습니다. 두 개의 원이 겹치는 부분은 특정 사건 A와 사건 B가 동시에 발생할 확률을 나타내며, 각각의 원은 사전 확률을 나타냅니다.
사전 확률과 베이즈 정리 시각화 예시
import matplotlib.pyplot as plt
from matplotlib_venn import venn2
# Define the probabilities
prior_A = 0.3 # P(A)
prior_B = 0.4 # P(B)
# Create Venn diagram
plt.figure(figsize=(10, 7))
venn = venn2(subsets=(prior_A, prior_B, 0), set_labels=('Event A', 'Event B'))
# Add labels for additional clarity
plt.text(-0.5, 0.1, f"P(A) = {prior_A}", fontsize=12, color='blue')
plt.text(0.5, 0.1, f"P(B) = {prior_B}", fontsize=12, color='orange')
# Add title and display
plt.title("Venn Diagram for Prior Probabilities P(A) and P(B)")
plt.show()
이 벤다이어그램은 사건 A와 사건 B의 사전 확률을 시각적으로 보여주며, 베이즈 정리에서 사전 확률이 어떻게 사용되는지를 이해하는 데 도움이 됩니다.