통계 변수는 데이터를 수집, 분석, 해석할 때 사용되는 기본적인 개념입니다. 변수를 이해하는 것은 통계 분석의 핵심입니다. 변수는 크게 두 가지로 나눌 수 있습니다: 질적 변수(명목 변수와 서열 변수)와 양적 변수(이산 변수와 연속 변수).
변수 (Variables)
1. 질적 변수 (Qualitative Variables)
1.1 명목 변수 (Nominal Variables)
- 설명: 명목 변수는 범주나 이름을 표현하며, 순서가 없습니다.
- 예시: 성별(남, 여), 혈액형(A, B, AB, O), 국가(한국, 미국, 일본).
- 분석 방법: 빈도 분석, 카이제곱 검정.
- 특징: 범주나 이름으로 표현되며, 순서가 없습니다.
1.2 서열 변수 (Ordinal Variables)
- 설명: 서열 변수는 범주나 이름을 표현하며, 순서가 있습니다.
- 예시: 교육 수준(초등학교, 중학교, 고등학교, 대학교), 만족도(매우 불만족, 불만족, 보통, 만족, 매우 만족), Education Level (교육 수준), Satisfaction (만족도), Military Rank (군대 계급)
- 분석 방법: 순위 분석, 순위 상관 분석.
- 특징: 데이터 간의 순서가 있지만, 간격은 일정하지 않습니다.
2. 양적 변수 (Quantitative Variables)
2.1 등간 변수(Discrete Variables) , 이산 변수 (Discrete Variables)
- 설명: 등간변수 or 이산 변수는 정수 값만을 가지며, 셀 수 있는 값입니다.
- 등간 예시: Temperature (온도), IQ Score (IQ 점수), Year (연도)
- 이산 예시: 학생 수, 자동차 수, 집의 방 수.
- 분석 방법: 빈도 분석, 평균, 분산.
- 특징: 순서와 간격이 일정하지만, 절대적인 0점이 없습니다.
2.2 연속 변수 (Continuous Variables)
- 설명: 연속 변수는 실수 값도 가질 수 있으며, 특정 구간 내의 모든 값을 포함할 수 있습니다.
- 예시: 키, 몸무게, 온도, Length (길이), Weight (무게), Time (시간)
- 분석 방법: 평균, 분산, 회귀 분석.
- 특징: 순서, 간격, 비율 비교가 가능하며, 절대적인 0점이 존재합니다.
변수의 예시
성별
- 종류: 질적 변수 – 명목 변수
- 값: 남, 여
교육 수준
- 종류: 질적 변수 – 서열 변수
- 값: 초등학교, 중학교, 고등학교, 대학교
자동차 수
- 종류: 양적 변수 – 이산 변수
- 값: 0, 1, 2, 3, …
몸무게
- 종류: 양적 변수 – 연속 변수
- 값: 55.5kg, 60.3kg, 70.0kg, …
변수의 척도
- 명목 척도 (Nominal Scale): 이름이나 범주로 측정되는 변수 (예: 성별, 혈액형).
- 서열 척도 (Ordinal Scale): 순서가 있는 변수 (예: 교육 수준, 만족도).
- 등간 척도 (Interval Scale): 순서와 더불어 차이를 측정할 수 있는 변수 (예: 온도, 지능지수).
- 비율 척도 (Ratio Scale): 순서와 차이뿐만 아니라 비율까지 측정할 수 있는 변수 (예: 키, 몸무게, 나이).
변수의 분석
통계 분석에서 변수를 적절히 선택하고 이해하는 것이 중요합니다. 변수의 종류에 따라 사용할 수 있는 분석 방법이 다르기 때문에, 올바른 변수 정의와 측정이 분석의 정확성을 높이는 데 필수적입니다.

척도 (Scale)
통계에서 척도(scale)는 변수의 측정 수준을 의미하며, 데이터의 특성과 분석 방법을 결정하는 데 중요한 역할을 합니다. 척도는 크게 네 가지로 분류됩니다: 명목 척도, 서열 척도, 등간 척도, 비율 척도입니다.
변수의 척도
- 명목 척도 (Nominal Scale): 이름이나 범주로 측정되는 변수 (예: 성별, 혈액형).
- 서열 척도 (Ordinal Scale): 순서가 있는 변수 (예: 교육 수준, 만족도).
- 등간 척도 (Interval Scale): 순서와 더불어 차이를 측정할 수 있는 변수 (예: 온도, 지능지수).
- 비율 척도 (Ratio Scale): 순서와 차이뿐만 아니라 비율까지 측정할 수 있는 변수 (예: 키, 몸무게, 나이).
1. 명목 척도 (Nominal Scale)
- 설명: 명목 척도는 데이터가 범주나 이름으로 표현되며, 순서가 없는 경우를 의미합니다. 각 범주는 상호 배타적이고 동등한 값을 가집니다.
- 특징:
- 데이터 간의 순서나 크기 비교가 불가능합니다.
- 각 범주는 고유한 이름이나 숫자로 구분됩니다.
- 예시:
- 성별: 남성, 여성
- 혈액형: A형, B형, AB형, O형
- 국가: 한국, 미국, 일본
- 분석 방법:
- 빈도 분석, 카이제곱 검정
2. 서열 척도 (Ordinal Scale)
- 설명: 서열 척도는 데이터 간의 순서가 있지만, 각 데이터 간의 간격은 일정하지 않은 경우를 의미합니다.
- 특징:
- 데이터 간의 순서 비교는 가능하지만, 간격의 크기나 비율은 비교할 수 없습니다.
- 각 범주의 상대적인 순서만 의미를 가집니다.
- 예시:
- 교육 수준: 초등학교, 중학교, 고등학교, 대학교
- 만족도: 매우 불만족, 불만족, 보통, 만족, 매우 만족
- 군대 계급: 이병, 일병, 상병, 병장
- 분석 방법:
- 순위 분석, 순위 상관 분석
3. 등간 척도 (Interval Scale)
- 설명: 등간 척도는 데이터 간의 순서뿐만 아니라, 각 데이터 간의 간격이 일정한 경우를 의미합니다. 하지만 절대적인 0점이 존재하지 않습니다.
- 특징:
- 데이터 간의 차이(간격)를 비교할 수 있습니다.
- 비율 비교는 불가능합니다.
- 절대적인 0점이 존재하지 않으므로, “없음”을 의미하지 않습니다.
- 예시:
- 온도(섭씨 또는 화씨): 10도, 20도, 30도 (온도 간의 차이는 일정하지만, 절대적인 0도는 존재하지 않음)
- IQ 점수: 100, 110, 120 (각 점수 간의 차이는 일정하지만, 0은 절대적 의미가 아님)
- 날짜: 연도 2000, 2001, 2002 (간격은 일정하지만, 0년은 절대적 의미가 아님)
- 분석 방법:
- 평균, 분산, 상관 분석
4. 비율 척도 (Ratio Scale)
- 설명: 비율 척도는 데이터 간의 순서와 간격뿐만 아니라, 절대적인 0점이 존재하여 비율 계산이 가능한 경우를 의미합니다.
- 특징:
- 데이터 간의 순서, 간격, 비율 비교가 모두 가능합니다.
- 절대적인 0점이 존재하여, “없음”을 의미합니다.
- 예시:
- 길이: 0cm, 10cm, 20cm (0cm는 길이가 없음)
- 무게: 0kg, 50kg, 100kg (0kg는 무게가 없음)
- 시간: 0초, 30초, 60초 (0초는 시간이 없음)
- 분석 방법:
- 평균, 분산, 상관 분석, 비율 계산
척도의 중요성
척도를 이해하는 것은 데이터 분석의 정확성과 효율성을 높이는 데 중요합니다. 데이터가 어떤 척도를 가지는지에 따라 사용할 수 있는 통계적 방법과 분석 도구가 다르기 때문입니다. 올바른 척도를 적용하면 데이터의 특성을 잘 반영하고, 분석 결과의 신뢰성을 높일 수 있습니다.