변동계수(Coefficient of Variation, CV)는 데이터 세트의 변동성을 측정하는 통계량 중 하나입니다. 변동계수는 표준편차를 평균으로 나눈 값으로, 데이터의 상대적 변동성을 나타냅니다. CV는 단위가 없기 때문에 서로 다른 단위나 규모의 데이터 세트를 비교할 때 유용합니다.
변동계수 공식
\(\)\( CV = \left( \frac{\sigma}{\mu} \right) \times 100 \% \)
여기서:
- \( \sigma \)는 표준편차 (Standard Deviation)
- \(\mu\)는 평균 (Mean)
변동계수의 의미
- CV가 낮을 때: 데이터가 평균에 가깝게 분포되어 있으며, 변동성이 적다는 것을 의미합니다.
- CV가 높을 때: 데이터가 평균으로부터 크게 분포되어 있으며, 변동성이 크다는 것을 의미합니다.
변동계수의 사용 예
- 경제학: 서로 다른 규모의 경제 지표(예: 두 나라의 GDP 성장률)의 변동성을 비교할 때 사용됩니다.
- 생명과학: 실험에서의 데이터 정확도나 정밀도를 비교할 때 사용됩니다.
- 경영학: 기업의 매출 또는 비용의 안정성을 평가할 때 사용됩니다.
예제
예제 1: 서로 다른 두 데이터 세트 비교
- 데이터 세트 1: 평균 50, 표준편차 10
- 데이터 세트 2: 평균 100, 표준편차 20
- 데이터 세트 1의 CV: \( \left( \frac{10}{50} \right) \times 100 = 20\% \)
- 데이터 세트 2의 CV: \( \left( \frac{20}{100} \right) \times 100 = 20\% \)
두 데이터 세트의 변동계수는 같기 때문에, 두 데이터 세트는 상대적으로 같은 정도의 변동성을 가진다고 할 수 있습니다.
예제 2: 실험 데이터의 정확도 비교
- 실험 1: 평균 200, 표준편차 5
- 실험 2: 평균 200, 표준편차 20
- 실험 1의 CV: \(\left( \frac{5}{200} \right) \times 100 = 2.5\%\)
- 실험 2의 CV: \(\left( \frac{20}{200} \right) \times 100 = 10\%\)
실험 1의 변동계수가 낮기 때문에, 실험 1이 실험 2보다 더 정확하고 정밀하다고 할 수 있습니다.

위 이미지는 두 가지 데이터 세트의 히스토그램과 변동계수를 보여줍니다.
- Data with Higher Variability (왼쪽 그래프): 평균이 50이고 표준편차가 15인 데이터로, 변동계수(CV)는 0.30입니다. 변동계수는 데이터의 변동성을 나타내며, 값이 클수록 변동성이 크다는 것을 의미합니다.
- Data with Lower Variability (오른쪽 그래프): 평균이 50이고 표준편차가 5인 데이터로, 변동계수(CV)는 0.10입니다. 이 데이터 세트는 변동성이 적은 것을 알 수 있습니다.
변동계수는 표준편차를 평균으로 나눈 값으로, 데이터의 상대적인 변동성을 측정하는 데 유용합니다. 이 값은 단위가 없기 때문에 서로 다른 데이터 세트의 변동성을 비교하는 데 사용할 수 있습니다.
결론
변동계수는 데이터의 변동성을 평가하고 서로 다른 데이터 세트를 비교하는 데 유용한 도구입니다. CV 값이 높을수록 데이터의 변동성이 크다는 것을 의미하며, 이는 해당 데이터의 안정성이 낮다는 것을 나타낼 수 있습니다. 반대로 CV 값이 낮을수록 데이터의 변동성이 적고, 데이터가 더 일관성이 있음을 의미합니다.