중심극한정리(CLT:Central Limit Theorem)

\(\)

중심극한정리(Central Limit Theorem, CLT)는 통계학에서 매우 중요한 이론 중 하나로, 표본 분포의 성질을 설명합니다. 중심극한정리는 다음과 같은 내용을 포함합니다:

정의

중심극한정리는 다음과 같은 조건을 만족하는 경우에 적용됩니다:

  • 충분히 큰 표본 크기(n)가 있다.
  • 표본이 모집단에서 무작위로 추출된다.
  • 표본의 크기가 커질수록, 표본 평균의 분포는 모집단의 분포와 상관없이 정규분포에 가까워진다.

즉, 어떤 모집단에서 표본을 추출하더라도, 그 표본들의 평균은 정규분포에 가까워진다는 것입니다. 이는 모집단이 정규분포를 따르지 않더라도 성립합니다.

수학적 표현

모집단의 평균을 \(\mu\), 표준편차를 \(\sigma\)라고 하고, 표본 크기를 (n)이라고 할 때, 표본 평균 \(\bar{X}\)의 분포는 다음과 같이 정규분포에 가까워집니다:
\[ \bar{X} \sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)\]

여기서:

  • \(\bar{X}\)는 표본 평균
  • \(N(\mu, \frac{\sigma}{\sqrt{n}})\)는 평균이 \(\mu\)이고 표준편차가 \(\frac{\sigma}{\sqrt{n}}\)인 정규분포

중요성

중심극한정리는 통계학에서 매우 중요한 역할을 합니다. 이는 실제로 많은 통계적 방법론과 추론이 중심극한정리에 기반하고 있기 때문입니다. 예를 들어, 가설 검정, 신뢰 구간 계산 등은 모두 중심극한정리를 이용하여 수행됩니다.

예제

예제 1: 주사위 굴리기

  • 주사위를 한 번 굴리면 결과는 1에서 6 사이의 값으로 균일하게 분포합니다.
  • 주사위를 30번 굴리고 그 평균을 계산합니다. 이 과정을 여러 번 반복합니다.
  • 각 표본 평균을 히스토그램으로 그리면, 그 분포는 정규분포에 가까워지는 것을 볼 수 있습니다.

예제 2: 비정규 분포

  • 비정규 분포(예: 지수 분포)를 따르는 모집단에서 표본을 추출합니다.
  • 표본 크기를 30으로 하고, 여러 번 반복하여 표본 평균을 구합니다.
  • 표본 평균의 분포는 정규분포에 가까워집니다.

시각적 설명

  • 원래 데이터 분포: 모집단의 원래 분포가 비정규분포라도, 예를 들어 왼쪽으로 치우친 지수분포일 수 있습니다.
  • 표본 평균의 분포: 표본 평균을 여러 번 계산하면, 그 분포는 점점 정규분포에 가까워집니다.

위 이미지는 중심극한정리(Central Limit Theorem, CLT)를 시각적으로 설명한 것입니다.

  • 왼쪽 그래프: 원래 데이터의 분포입니다. 여기서는 지수 분포(Exponential Distribution)를 사용하였으며, 이 분포는 비정규 분포입니다. 데이터는 왼쪽으로 치우쳐 있습니다.
  • 오른쪽 그래프: 표본 평균의 분포입니다. 여러 개의 표본(각 표본의 크기는 30)을 추출하고 각 표본의 평균을 계산한 후, 그 평균들의 분포를 나타냅니다. 중심극한정리에 따르면, 비록 원래 데이터가 비정규 분포를 따르더라도, 충분히 큰 표본의 평균 분포는 정규 분포에 가까워지게 됩니다.

이 예제에서는 원래 비정규 분포인 지수 분포에서 표본을 여러 번 추출하여 그 표본 평균을 구했을 때, 그 표본 평균의 분포가 정규 분포에 가까워지는 것을 볼 수 있습니다. 이는 중심극한정리가 성립함을 시각적으로 보여줍니다.

결론

중심극한정리는 표본 크기가 충분히 크다면, 표본 평균의 분포가 모집단의 분포 형태에 관계없이 정규분포에 가까워진다는 중요한 통계적 원리입니다. 이는 다양한 통계적 추론과 분석에 중요한 기초를 제공합니다.

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

위로 스크롤