30분
데이터 로딩 및 전처리
Day 5: NYC 택시 데이터 분석 프로젝트
데이터 로딩 및 전처리
pandas 고급 & 대용량 데이터 처리 > Day 5: NYC 택시 데이터 분석 프로젝트
학습 목표
대용량 데이터를 효율적으로 로딩한다 dtype 최적화를 적용한다
데이터 로딩 및 전처리
단계
- 샘플 데이터 생성 (실제 데이터 구조 모방)
- dtype 최적화 적용
- 기본 전처리 (결측치, 이상치)
- Parquet으로 저장
팁
- 먼저 1000행만 읽어서 구조 파악
- dtype을 read_csv에서 지정
- category 타입 적극 활용
에디터 로딩 중...
정답 보기
에디터 로딩 중...