📊 “왜 표준편차는 n과 n-1로 나눌까?”
통계 초보도 10분 만에 완벽 이해하는 핵심 원리
📌 목차
- 왜 표준편차 공식이 두 가지일까?
- 모집단(Population)과 표본(Sample)의 차이
- n으로 나누면 생기는 문제점
- 왜 n-1로 나누는가? (핵심 원리)
- 기대값(Expectation)으로 증명하는 이유
- 엑셀에서 실제로 확인해보기
- 실전 활용 방법 (통계·투자·데이터 분석)
- 한눈에 요약
1️⃣ 왜 표준편차 공식이 두 가지일까?
처음 통계를 배우면 이렇게 배웁니다.
- 분산(Variance): 평균에서 떨어진 거리의 제곱을 평균낸 값
- 표준편차(Standard Deviation): 분산에 루트를 씌운 값
그런데 이상합니다.
- 어떤 때는 n으로 나누고
- 어떤 때는 n-1로 나눕니다
엑셀을 켜보면 더 혼란스럽습니다.
- STDEV.P (모집단)
- STDEV.S (표본)
같은 데이터 1, 2, 3을 넣으면 결과가 다릅니다.
왜 이런 일이 벌어질까요?
2️⃣ 모집단(Population)과 표본(Sample)의 차이
📌 모집단(Population)
전체 데이터입니다.
예: 대한민국 전체 성인 키, 모든 삼성전자 주가 데이터
모평균 = μ (뮤)
모표준편차 = σ (시그마)
📌 표본(Sample)
전체 중 일부만 뽑은 데이터입니다.
예: 여론조사 1,000명
최근 1년치 주가
표본평균 = x̄ (엑스바)
표본표준편차 = s
💡 핵심 차이:
- 모집단은 "전체"
- 표본은 "일부"
3️⃣ n으로 나누면 생기는 문제
예를 들어 모집단이 1, 2, 3이라고 해봅시다.
모집단 평균은 2
모집단 표준편차는 약 0.82
이제 표본을 2개씩 뽑아봅니다.
가능한 표본:
- (1,2)
- (2,3)
- (1,3)
이때 n으로 나누면 대부분 표준편차가 0.5로 나옵니다.
평균적으로 계산해보면 약 0.67
👉 실제 모표준편차 0.82보다 작습니다.
즉,
🔥 표본 표준편차를 n으로 나누면 모집단보다 작게 추정되는 경향(과소추정, Underestimation) 이 발생합니다.
4️⃣ 왜 n-1로 나누는가? (직관적 이해)
🎯 산포도(Spread) 문제
표준편차는 데이터가 얼마나 퍼져 있는지 측정합니다.
그런데 표본은 일부만 뽑습니다.
예를 들어,
대한민국 전체 키 범위는 100cm 이상 차이날 수 있습니다.
하지만 10명만 뽑으면?
→ 그 안에서 최대-최소 차이는 훨씬 작습니다.
즉,
📉 표본은 산포도를 과소평가합니다.
그래서 우리는 인위적으로 값을 키워줘야 합니다.
그 방법이 바로:
👉 n 대신 n-1로 나누는 것
n-1로 나누면:
- 작은 수로 나누기 때문에 값이 커짐
- 표본이 작을수록 보정 효과 큼
- 표본이 클수록 보정 효과 작음
이를 자유도(Degrees of Freedom) 라고 합니다.
5️⃣ 수학적으로 왜 n-1이 정답인가?
기대값(Expectation)을 계산해 보면 다음이 나옵니다.
표본 분산을 n으로 나누면 기대값은
→ (n-1)/n × 모분산
즉, 항상 모분산보다 작습니다.
하지만 n-1로 나누면:
→ 기대값이 정확히 모분산과 같아집니다.
이를
📌 불편추정량(Unbiased Estimator) 이라고 합니다.
"기대했을 때 치우치지 않는 추정값"
6️⃣ 엑셀에서 직접 확인하기
실행해보기
□ 엑셀 실행
□ A1~A3에 1, 2, 3 입력
□ =STDEV.P(A1:A3)
□ =STDEV.S(A1:A3)
결과 비교:
- STDEV.P → 0.816
- STDEV.S → 1
차이 확인 완료.
7️⃣ 실전 활용 방법 (강의 활용 가능)
📊 데이터 분석할 때
□ 전체 데이터를 다 가지고 있다 → n 사용
□ 일부 샘플로 전체를 추정한다 → n-1 사용
📈 투자 분석에서 활용
주식의 변동성(Volatility)은 표준편차로 측정합니다.
최근 1년 수익률로 전체 장기 변동성을 추정하려면?
👉 반드시 n-1 사용
예를 들어:
- 삼성전자 (Samsung Electronics)
- 애플 (Apple Inc.)
- 엔비디아 (NVIDIA Corporation)
이들의 연간 변동성 계산 시
과소추정하면 리스크를 잘못 판단합니다.
투자에서 리스크 과소평가는 치명적입니다.
🔥 실전 적용 체크리스트
□ 백테스트할 때 표본인지 확인
□ 변동성 계산 시 자유도 확인
□ 통계 프로그램 기본 설정 확인
□ 엑셀에서 S와 P 구분
8️⃣ 이해를 돕는 그림
(그림 삽입 권장)
📌 그림1: 모집단 vs 표본 산포도 비교
📌 그림2: n과 n-1 그래프 차이
📌 그림3: 표본 수 증가 시 보정 효과 감소
🎓 한 줄 핵심 정리
“표본은 항상 실제보다 덜 퍼져 보인다. 그래서 n-1로 보정한다.”
🧠 요약
- 모집단은 n으로 나눈다
- 표본은 n-1로 나눈다
- n으로 나누면 과소추정 발생
- n-1은 불편추정량
- 표본이 작을수록 보정 효과 큼
- 투자 리스크 계산 시 반드시 구분해야 함
📚 참고자료
- 통계학 개론
- Khan Academy Statistics
- Investopedia – Standard Deviation
- 엑셀 공식 문서
🔎 태그
#표준편차 #분산 #자유도 #통계기초 #불편추정량 #엑셀통계 #투자리스크 #데이터분석 #통계강의
'과학' 카테고리의 다른 글
| 📚 “인생이 바뀌는 책 5권” — 뇌과학자가 말하는 진짜 독서 전략 완전 해부 (0) | 2026.03.19 |
|---|---|
| 방사선을 먹고 우주를 누비는 곰팡이: 우주 생존의 새로운 비밀! 🚀🌌 (0) | 2026.03.18 |
| 양자와 상대성의 춤 ― 우리가 사는 세상을 바꾼 두 이론 완전 이해하기 (1) | 2025.10.31 |
| 🧬 한국이 노벨의학상을 못 받는 진짜 이유 (1) | 2025.10.29 |
| 🧠 몸속 배신자 찾기: 면역의 비밀과 암 정복의 열쇠 (1) | 2025.10.29 |