15분
"돌아가는데 왜 테스트해요?"
Day 5: 테스트와 발표
"돌아가는데 왜 테스트해요?"
Phase 1 캡스톤: E2E 데이터 파이프라인 > Day 5: 테스트와 발표
학습 목표
테스트의 필요성을 이해한다 데이터 파이프라인 테스트의 특수성을 파악한다
"돌아가는데 왜 테스트해요?"
"테스트 코드 짤 시간에 기능 하나 더 만들어요."
2주 후...
"프로덕션에서 데이터가 이상하게 나와요!" "아, 어제 코드 수정했는데 그게 영향을 준 것 같아요." "그럼 빨리 롤백해요!" "근데... 어디가 문제인지 모르겠어요."
테스트 없는 코드 = 시한폭탄
특히 데이터 파이프라인은:
- 매일 자동 실행 (감시자 없음)
- 문제 발생 시 이미 잘못된 데이터가 퍼져 있음
- 수정해도 과거 데이터는 복구 어려움
데이터 파이프라인 테스트의 특수성
일반 앱 테스트:
에디터 로딩 중...
데이터 파이프라인 테스트:
에디터 로딩 중...
도전 과제:
- 대용량 데이터를 어떻게 테스트?
- Spark, DB, S3를 어떻게 격리?
- 시간에 의존하는 로직은?
오늘 할 일
- 단위 테스트 - 개별 함수/클래스
- 통합 테스트 - 컴포넌트 연동
- 데이터 품질 테스트 - Great Expectations
- 발표 준비 - 프로젝트 정리
마지막 날, 제대로 마무리하자.