🏆45

Weekly Challenge: 완성된 분석 리포트

Day 5: NYC 택시 데이터 분석 프로젝트

학습 목표

이번 주 학습한 모든 기술을 적용한다 재사용 가능한 분석 파이프라인을 구축한다

요구사항

dtype 최적화 적용

최소 4개 분석 함수 구현

리포트 자동 생성

pandas/Polars 모두 지원

평가 기준
  • 코드 품질 (모듈화, 문서화)
  • 분석 깊이 (인사이트 품질)
  • 성능 (대용량 처리 가능)
  • 재사용성 (다른 데이터에 적용 가능)
보너스
  • 시각화 추가 (matplotlib/plotly)
  • 자동화된 테스트
  • 실제 NYC TLC 데이터로 검증
  • CLI 인터페이스

Weekly Challenge: NYC 택시 분석 완성

이번 주 배운 모든 기술을 활용하여 재사용 가능한 분석 파이프라인을 구축하세요.

요구사항

  1. 데이터 로딩 모듈

    • dtype 최적화
    • Parquet 캐싱
    • 청크 처리 옵션
  2. 분석 함수들

    • 시간 패턴 분석
    • 지역 분석
    • 수익 분석
    • 팁 패턴 분석
  3. 리포트 생성

    • 마크다운 또는 HTML 출력
    • 핵심 지표 + 상세 분석
  4. 성능 최적화

    • pandas와 Polars 선택 가능
    • 벡터화 연산 사용

제출물

  • Python 모듈 (taxi_analysis.py)
  • 실행 예제 노트북
  • 분석 리포트 (마크다운)