20분
dtype 최적화 실습
Day 1: 1GB CSV 열었더니 컴퓨터가 멈췄다
dtype 최적화 실습
pandas 고급 & 대용량 데이터 처리 > Day 1: 1GB CSV 열었더니 컴퓨터가 멈췄다
학습 목표
컬럼별 최적 dtype을 자동으로 추론한다 최적화 전후 메모리를 비교한다
dtype 자동 최적화 함수 구현
DataFrame의 dtype을 자동으로 최적화하는 함수를 만듭니다.
최적화 규칙
- 정수: min/max 확인 후 최소 타입 선택
- 실수: float64 → float32
- 문자열: 유니크 비율 50% 이하면 category
요구사항
- optimize_integers(): int8/16/32 자동 선택
- optimize_floats(): float32로 변환
- optimize_objects(): category로 변환
- compare_memory(): 전후 비교 출력
에디터 로딩 중...
정답 보기
에디터 로딩 중...