15분
왜 MultiIndex가 필요한가?
Day 2: 이 데이터, 어떻게 피벗해요?
왜 MultiIndex가 필요한가?
pandas 고급 & 대용량 데이터 처리 > Day 2: 이 데이터, 어떻게 피벗해요?
학습 목표
MultiIndex의 개념과 필요성을 이해한다 계층적 데이터 구조의 장점을 파악한다
이런 데이터를 어떻게 표현하지?
연도별, 분기별, 지역별 매출 데이터가 있다.
에디터 로딩 중...
방법 1: 컬럼 여러 개 (비효율)
에디터 로딩 중...
문제점: 2023년 서울 데이터 가져오려면?
에디터 로딩 중...
방법 2: MultiIndex (효율적)
에디터 로딩 중...
에디터 로딩 중...
데이터 접근:
에디터 로딩 중...
MultiIndex의 장점
| 장점 | 설명 |
|---|---|
| 직관적 접근 | 계층 구조로 데이터 탐색 |
| 빠른 검색 | 인덱스 기반 O(1) 접근 |
| 그룹 연산 | level 기준 집계 용이 |
| 메모리 효율 | 중복 문자열 저장 안 함 |
언제 사용하나?
- 시계열 + 카테고리 조합 (연도-월-지역)
- 계층적 분류 체계 (대분류-중분류-소분류)
- pivot_table 결과 분석
- groupby 결과 후처리