15분
Polars 핵심 개념
Day 4: pandas 10배 빠른 게 있다고?
Polars 핵심 개념
pandas 고급 & 대용량 데이터 처리 > Day 4: pandas 10배 빠른 게 있다고?
학습 목표
Polars의 Expression 시스템을 이해한다 Lazy Evaluation의 원리를 파악한다
Polars의 3가지 핵심
1. Expression (표현식)
모든 연산은 표현식으로 정의한다.
에디터 로딩 중...
2. Context (컨텍스트)
표현식이 어디서 실행되는지 결정한다.
| 컨텍스트 | 메서드 | 결과 |
|---|---|---|
| Selection | select(), with_columns() | 컬럼 선택/추가 |
| Filtering | filter() | 행 필터링 |
| Grouping | group_by().agg() | 그룹 집계 |
에디터 로딩 중...
3. Lazy Evaluation
실행을 나중으로 미룬다.
에디터 로딩 중...
Lazy의 장점:
- 쿼리 자동 최적화
- 불필요한 컬럼 읽기 방지
- 메모리 효율적 처리
pandas → Polars 마이그레이션
| pandas | Polars |
|---|---|
| df['col'] | df.select('col') |
| df[['a', 'b']] | df.select(['a', 'b']) |
| df[df['a'] > 0] | df.filter(pl.col('a') > 0) |
| df['new'] = ... | df.with_columns(...) |
| df.groupby() | df.group_by() |
| df.reset_index() | 불필요 (인덱스 없음) |