15

"돌아가는데 왜 테스트해요?"

Day 5: 테스트와 발표

학습 목표

테스트의 필요성을 이해한다 데이터 파이프라인 테스트의 특수성을 파악한다

"돌아가는데 왜 테스트해요?"

"테스트 코드 짤 시간에 기능 하나 더 만들어요."

2주 후...

"프로덕션에서 데이터가 이상하게 나와요!" "아, 어제 코드 수정했는데 그게 영향을 준 것 같아요." "그럼 빨리 롤백해요!" "근데... 어디가 문제인지 모르겠어요."

테스트 없는 코드 = 시한폭탄

특히 데이터 파이프라인은:

  • 매일 자동 실행 (감시자 없음)
  • 문제 발생 시 이미 잘못된 데이터가 퍼져 있음
  • 수정해도 과거 데이터는 복구 어려움

데이터 파이프라인 테스트의 특수성

일반 앱 테스트:

에디터 로딩 중...

데이터 파이프라인 테스트:

에디터 로딩 중...

도전 과제:

  • 대용량 데이터를 어떻게 테스트?
  • Spark, DB, S3를 어떻게 격리?
  • 시간에 의존하는 로직은?

오늘 할 일

  1. 단위 테스트 - 개별 함수/클래스
  2. 통합 테스트 - 컴포넌트 연동
  3. 데이터 품질 테스트 - Great Expectations
  4. 발표 준비 - 프로젝트 정리

마지막 날, 제대로 마무리하자.