25분
정규분포: 자연의 가장 흔한 패턴
Day 2: 데이터의 흩어짐
정규분포: 자연의 가장 흔한 패턴
통계 기초: 스토리로 배우는 데이터 분석 > Day 2: 데이터의 흩어짐
학습 목표
정규분포의 특징을 이해한다 68-95-99.7 규칙을 적용할 수 있다
정규분포란?
종 모양의 대칭적인 분포
에디터 로딩 중...
자연과 사회 현상의 많은 데이터가 정규분포를 따른다:
- 사람의 키
- IQ 점수
- 제품 불량률
- 측정 오차
정규분포의 특징
- 평균 = 중앙값 = 최빈값 (가운데가 가장 높음)
- 좌우 대칭
- 평균과 표준편차만 알면 전체 분포를 알 수 있음
에디터 로딩 중...
68-95-99.7 규칙 (★암기★)
정규분포에서:
에디터 로딩 중...
IQ 예시 (평균=100, 표준편차=15)
에디터 로딩 중...
IQ 145 이상? 상위 0.15% (1000명 중 1~2명) IQ 70 이하? 하위 약 2.5%
Python으로 정규분포 다루기
에디터 로딩 중...
정규분포가 아닌 경우
모든 데이터가 정규분포는 아니다.
| 분포 유형 | 예시 | 특징 |
|---|---|---|
| 정규분포 | IQ, 키 | 대칭, 종 모양 |
| 오른쪽 치우침 | 소득, 집값 | 고소득/비싼 집 소수 |
| 균등분포 | 주사위 눈 | 모든 값 동일 확률 |
| 이봉분포 | 시험 점수 (쉬운/어려운) | 두 개의 봉우리 |
중요: 정규분포가 아니면 68-95-99.7 규칙이 적용되지 않는다!