과학

📊 “왜 표준편차는 n과 n-1로 나눌까?”통계 초보도 10분 만에 완벽 이해하는 핵심 원리

capstone012 2026. 2. 20. 11:25
반응형
SMALL

 

📊 “왜 표준편차는 n과 n-1로 나눌까?”

통계 초보도 10분 만에 완벽 이해하는 핵심 원리


📌 목차

  1. 왜 표준편차 공식이 두 가지일까?
  2. 모집단(Population)과 표본(Sample)의 차이
  3. n으로 나누면 생기는 문제점
  4. 왜 n-1로 나누는가? (핵심 원리)
  5. 기대값(Expectation)으로 증명하는 이유
  6. 엑셀에서 실제로 확인해보기
  7. 실전 활용 방법 (통계·투자·데이터 분석)
  8. 한눈에 요약

1️⃣ 왜 표준편차 공식이 두 가지일까?

처음 통계를 배우면 이렇게 배웁니다.

  • 분산(Variance): 평균에서 떨어진 거리의 제곱을 평균낸 값
  • 표준편차(Standard Deviation): 분산에 루트를 씌운 값

그런데 이상합니다.

  • 어떤 때는 n으로 나누고
  • 어떤 때는 n-1로 나눕니다

엑셀을 켜보면 더 혼란스럽습니다.

  • STDEV.P (모집단)
  • STDEV.S (표본)

같은 데이터 1, 2, 3을 넣으면 결과가 다릅니다.

왜 이런 일이 벌어질까요?


2️⃣ 모집단(Population)과 표본(Sample)의 차이

📌 모집단(Population)

전체 데이터입니다.
예: 대한민국 전체 성인 키, 모든 삼성전자 주가 데이터

모평균 = μ (뮤)
모표준편차 = σ (시그마)


📌 표본(Sample)

전체 중 일부만 뽑은 데이터입니다.
예: 여론조사 1,000명
최근 1년치 주가

표본평균 = x̄ (엑스바)
표본표준편차 = s


💡 핵심 차이:

  • 모집단은 "전체"
  • 표본은 "일부"

3️⃣ n으로 나누면 생기는 문제

예를 들어 모집단이 1, 2, 3이라고 해봅시다.

모집단 평균은 2
모집단 표준편차는 약 0.82

이제 표본을 2개씩 뽑아봅니다.

가능한 표본:

  • (1,2)
  • (2,3)
  • (1,3)

이때 n으로 나누면 대부분 표준편차가 0.5로 나옵니다.

평균적으로 계산해보면 약 0.67

👉 실제 모표준편차 0.82보다 작습니다.

즉,

🔥 표본 표준편차를 n으로 나누면 모집단보다 작게 추정되는 경향(과소추정, Underestimation) 이 발생합니다.


4️⃣ 왜 n-1로 나누는가? (직관적 이해)

🎯 산포도(Spread) 문제

표준편차는 데이터가 얼마나 퍼져 있는지 측정합니다.

그런데 표본은 일부만 뽑습니다.

예를 들어,

대한민국 전체 키 범위는 100cm 이상 차이날 수 있습니다.

하지만 10명만 뽑으면?
→ 그 안에서 최대-최소 차이는 훨씬 작습니다.

즉,

📉 표본은 산포도를 과소평가합니다.

그래서 우리는 인위적으로 값을 키워줘야 합니다.

그 방법이 바로:

👉 n 대신 n-1로 나누는 것

n-1로 나누면:

  • 작은 수로 나누기 때문에 값이 커짐
  • 표본이 작을수록 보정 효과 큼
  • 표본이 클수록 보정 효과 작음

이를 자유도(Degrees of Freedom) 라고 합니다.


5️⃣ 수학적으로 왜 n-1이 정답인가?

기대값(Expectation)을 계산해 보면 다음이 나옵니다.

표본 분산을 n으로 나누면 기대값은

→ (n-1)/n × 모분산

즉, 항상 모분산보다 작습니다.

하지만 n-1로 나누면:

→ 기대값이 정확히 모분산과 같아집니다.

이를

📌 불편추정량(Unbiased Estimator) 이라고 합니다.

"기대했을 때 치우치지 않는 추정값"


6️⃣ 엑셀에서 직접 확인하기

실행해보기

□ 엑셀 실행
□ A1~A3에 1, 2, 3 입력
□ =STDEV.P(A1:A3)
□ =STDEV.S(A1:A3)

결과 비교:

  • STDEV.P → 0.816
  • STDEV.S → 1

차이 확인 완료.


7️⃣ 실전 활용 방법 (강의 활용 가능)

📊 데이터 분석할 때

□ 전체 데이터를 다 가지고 있다 → n 사용
□ 일부 샘플로 전체를 추정한다 → n-1 사용


📈 투자 분석에서 활용

주식의 변동성(Volatility)은 표준편차로 측정합니다.

최근 1년 수익률로 전체 장기 변동성을 추정하려면?

👉 반드시 n-1 사용

예를 들어:

  • 삼성전자 (Samsung Electronics)
  • 애플 (Apple Inc.)
  • 엔비디아 (NVIDIA Corporation)

이들의 연간 변동성 계산 시

과소추정하면 리스크를 잘못 판단합니다.

투자에서 리스크 과소평가는 치명적입니다.


🔥 실전 적용 체크리스트

□ 백테스트할 때 표본인지 확인
□ 변동성 계산 시 자유도 확인
□ 통계 프로그램 기본 설정 확인
□ 엑셀에서 S와 P 구분


8️⃣ 이해를 돕는 그림

(그림 삽입 권장)

📌 그림1: 모집단 vs 표본 산포도 비교
📌 그림2: n과 n-1 그래프 차이
📌 그림3: 표본 수 증가 시 보정 효과 감소


🎓 한 줄 핵심 정리

“표본은 항상 실제보다 덜 퍼져 보인다. 그래서 n-1로 보정한다.”


🧠 요약

  • 모집단은 n으로 나눈다
  • 표본은 n-1로 나눈다
  • n으로 나누면 과소추정 발생
  • n-1은 불편추정량
  • 표본이 작을수록 보정 효과 큼
  • 투자 리스크 계산 시 반드시 구분해야 함

📚 참고자료

  • 통계학 개론
  • Khan Academy Statistics
  • Investopedia – Standard Deviation
  • 엑셀 공식 문서

🔎 태그

#표준편차 #분산 #자유도 #통계기초 #불편추정량 #엑셀통계 #투자리스크 #데이터분석 #통계강의

 

반응형
LIST