25분
상관관계 ≠ 인과관계: 가장 중요한 구분
Day 3: 연관성 찾기
상관관계 ≠ 인과관계: 가장 중요한 구분
통계 기초: 스토리로 배우는 데이터 분석 > Day 3: 연관성 찾기
학습 목표
상관관계와 인과관계의 차이를 명확히 구분한다 숨겨진 변수의 개념을 이해한다
"상관관계 = 인과관계" 착각의 위험
상관관계: A와 B가 함께 변한다 인과관계: A가 B를 유발한다 (A → B)
에디터 로딩 중...
유명한 사례 1: 아이스크림과 익사 사고
에디터 로딩 중...
에디터 로딩 중...
유명한 사례 2: 신발 크기와 수학 점수 (아동)
에디터 로딩 중...
숨겨진 변수 (Confounding Variable)
두 변수에 모두 영향을 주는 제3의 변수
에디터 로딩 중...
A와 B는 상관있어 보이지만, 실제 원인은 다른 곳에.
광고비 사례 다시 보기
에디터 로딩 중...
광고비와 매출은 상관있지만, 광고비를 늘린다고 매출이 오르는 건 아닐 수 있다.
인과관계를 확인하는 방법
1. 무작위 통제 실험 (RCT)
에디터 로딩 중...
2. 시간 순서 확인
에디터 로딩 중...
3. 이론적 메커니즘
에디터 로딩 중...
실무에서 자주 하는 실수
| 주장 | 문제점 |
|---|---|
| "우리 앱 설치자가 매출이 높다" | 앱 때문인지, 기존 충성 고객이 앱을 깔은 건지? |
| "광고 본 사람이 더 많이 구매한다" | 관심 있는 사람이 광고를 본 건지? |
| "교육 받은 직원 성과가 좋다" | 의욕적인 직원이 교육을 신청한 건지? |
항상 "역인과"와 "숨겨진 변수"를 의심하라!