30

데이터 로딩 및 전처리

Day 5: NYC 택시 데이터 분석 프로젝트

학습 목표

대용량 데이터를 효율적으로 로딩한다 dtype 최적화를 적용한다

데이터 로딩 및 전처리

단계

  1. 샘플 데이터 생성 (실제 데이터 구조 모방)
  2. dtype 최적화 적용
  3. 기본 전처리 (결측치, 이상치)
  4. Parquet으로 저장

  • 먼저 1000행만 읽어서 구조 파악
  • dtype을 read_csv에서 지정
  • category 타입 적극 활용
에디터 로딩 중...
정답 보기
에디터 로딩 중...