15분
apply vs transform vs agg
Day 3: 왜 이렇게 느려요?
apply vs transform vs agg
pandas 고급 & 대용량 데이터 처리 > Day 3: 왜 이렇게 느려요?
학습 목표
apply, transform, agg의 차이를 이해한다 적절한 메서드를 선택한다
apply() - 만능이지만 느림
에디터 로딩 중...
문제: Python 함수를 매번 호출해서 느림
transform() - 원본 크기 유지
에디터 로딩 중...
특징: 원본 DataFrame과 같은 크기 반환
agg() - 집계 결과만
에디터 로딩 중...
특징: 그룹 수만큼 행 반환
속도 비교
| 메서드 | 속도 | 용도 |
|---|---|---|
| 벡터 연산 | ★★★★★ | 가능하면 항상 |
| transform | ★★★★☆ | 그룹 통계를 각 행에 |
| agg | ★★★★☆ | 그룹 집계 |
| apply | ★★☆☆☆ | 복잡한 커스텀 로직 |
실전 패턴
그룹별 정규화
에디터 로딩 중...
그룹 내 순위
에디터 로딩 중...
그룹 내 비율
에디터 로딩 중...