15분
왜 이렇게 느려요?
Day 3: 왜 이렇게 느려요?
왜 이렇게 느려요?
pandas 고급 & 대용량 데이터 처리 > Day 3: 왜 이렇게 느려요?
학습 목표
pandas 성능 문제의 원인을 이해한다 느린 코드와 빠른 코드의 차이를 파악한다
"왜 이렇게 느려요?"
"이 코드 돌리는데 30분이나 걸려요..."
코드를 보니:
에디터 로딩 중...
30분이 걸리는 이 코드, 어떻게 바꾸면 1초로 만들 수 있을까?
pandas가 느린 3가지 이유
1. Python 루프 사용
에디터 로딩 중...
2. 문자열 연산
에디터 로딩 중...
3. 잘못된 데이터 타입
에디터 로딩 중...
오늘 배울 것
| 주제 | 속도 향상 |
|---|---|
| 벡터화 연산 | 100배 이상 |
| apply vs transform | 10배 |
| 문자열 최적화 | 5-20배 |
| eval/query | 2-5배 |
| Numba/Cython | 10-100배 |
목표: 30분 걸리는 코드를 1초로 만들기