20분
중앙값: 평균의 거짓말을 막는 방법
Day 1: 평균의 함정
중앙값: 평균의 거짓말을 막는 방법
통계 기초: 스토리로 배우는 데이터 분석 > Day 1: 평균의 함정
학습 목표
중앙값의 개념과 계산 방법을 이해한다 중앙값이 평균보다 적절한 상황을 파악한다
중앙값이란?
중앙값(Median) = 데이터를 정렬했을 때 가운데 값
에디터 로딩 중...
홀수 개 vs 짝수 개
홀수 개: 가운데 값
에디터 로딩 중...
짝수 개: 가운데 두 값의 평균
에디터 로딩 중...
Python으로 중앙값 계산
에디터 로딩 중...
중앙값의 강점: 이상치에 강건함
에디터 로딩 중...
평균은 32 → 60으로 뛰었는데, 중앙값은 32 → 32.5로 거의 변화가 없다.
연봉 회사 다시 보기
에디터 로딩 중...
면접관이 "평균 연봉 1억"이라고 했을 때: "중앙값 연봉은 얼마인가요?"라고 물어봤어야 했다.
언제 평균 vs 중앙값?
| 상황 | 추천 지표 | 이유 |
|---|---|---|
| 정규분포 | 평균 | 대칭이면 평균 = 중앙값 |
| 소득, 집값 | 중앙값 | 고소득자/강남이 왜곡 |
| 응답 시간 | 중앙값 | 장애 시간이 왜곡 |
| 시험 점수 (정상) | 평균 | 대칭에 가까움 |