15

Polars 핵심 개념

Day 4: pandas 10배 빠른 게 있다고?

학습 목표

Polars의 Expression 시스템을 이해한다 Lazy Evaluation의 원리를 파악한다

Polars의 3가지 핵심

1. Expression (표현식)

모든 연산은 표현식으로 정의한다.

에디터 로딩 중...

2. Context (컨텍스트)

표현식이 어디서 실행되는지 결정한다.

컨텍스트메서드결과
Selectionselect(), with_columns()컬럼 선택/추가
Filteringfilter()행 필터링
Groupinggroup_by().agg()그룹 집계
에디터 로딩 중...

3. Lazy Evaluation

실행을 나중으로 미룬다.

에디터 로딩 중...

Lazy의 장점:

  • 쿼리 자동 최적화
  • 불필요한 컬럼 읽기 방지
  • 메모리 효율적 처리

pandas → Polars 마이그레이션

pandasPolars
df['col']df.select('col')
df[['a', 'b']]df.select(['a', 'b'])
df[df['a'] > 0]df.filter(pl.col('a') > 0)
df['new'] = ...df.with_columns(...)
df.groupby()df.group_by()
df.reset_index()불필요 (인덱스 없음)