🏆45분
Weekly Challenge: 완성된 분석 리포트
Day 5: NYC 택시 데이터 분석 프로젝트
Weekly Challenge: 완성된 분석 리포트
pandas 고급 & 대용량 데이터 처리 > Day 5: NYC 택시 데이터 분석 프로젝트
학습 목표
이번 주 학습한 모든 기술을 적용한다 재사용 가능한 분석 파이프라인을 구축한다
요구사항
dtype 최적화 적용
최소 4개 분석 함수 구현
리포트 자동 생성
pandas/Polars 모두 지원
평가 기준
- • 코드 품질 (모듈화, 문서화)
- • 분석 깊이 (인사이트 품질)
- • 성능 (대용량 처리 가능)
- • 재사용성 (다른 데이터에 적용 가능)
보너스
- • 시각화 추가 (matplotlib/plotly)
- • 자동화된 테스트
- • 실제 NYC TLC 데이터로 검증
- • CLI 인터페이스
Weekly Challenge: NYC 택시 분석 완성
이번 주 배운 모든 기술을 활용하여 재사용 가능한 분석 파이프라인을 구축하세요.
요구사항
-
데이터 로딩 모듈
- dtype 최적화
- Parquet 캐싱
- 청크 처리 옵션
-
분석 함수들
- 시간 패턴 분석
- 지역 분석
- 수익 분석
- 팁 패턴 분석
-
리포트 생성
- 마크다운 또는 HTML 출력
- 핵심 지표 + 상세 분석
-
성능 최적화
- pandas와 Polars 선택 가능
- 벡터화 연산 사용
제출물
- Python 모듈 (taxi_analysis.py)
- 실행 예제 노트북
- 분석 리포트 (마크다운)