15분
최빈값: 가장 흔한 값
Day 1: 평균의 함정
최빈값: 가장 흔한 값
통계 기초: 스토리로 배우는 데이터 분석 > Day 1: 평균의 함정
학습 목표
최빈값의 개념을 이해한다 최빈값이 유용한 상황을 파악한다
최빈값이란?
최빈값(Mode) = 가장 자주 나타나는 값
에디터 로딩 중...
Python으로 최빈값 계산
에디터 로딩 중...
최빈값이 유용한 경우
1. 범주형 데이터
에디터 로딩 중...
2. 이산적인 데이터
에디터 로딩 중...
최빈값의 한계
1. 여러 개일 수 있다 (다봉분포)
에디터 로딩 중...
2. 모두 1번씩만 나오면 의미 없음
에디터 로딩 중...
세 가지 대표값 비교
| 지표 | 계산 | 장점 | 단점 |
|---|---|---|---|
| 평균 | 합/개수 | 모든 데이터 반영 | 이상치에 민감 |
| 중앙값 | 가운데 값 | 이상치에 강건 | 극단값 무시 |
| 최빈값 | 가장 빈번 | 범주형에 유용 | 없거나 여러 개 |