25

SELECT & WHERE: 컬럼 선택과 필터링

Day 2: SQL 잘하면 Spark도 잘한다

학습 목표

select()로 원하는 컬럼을 선택할 수 있다 filter()로 조건에 맞는 row를 필터링할 수 있다

SQL ↔ Spark 변환

SQL:

에디터 로딩 중...

Spark:

에디터 로딩 중...

컬럼 참조 방법 3가지

에디터 로딩 중...

권장: col() 함수 사용 (가장 명시적)


필터 조건 작성법

에디터 로딩 중...

주의: & | ~ 사용 시 괄호 필수!

에디터 로딩 중...
힌트 보기
  • select("col1", "col2")로 컬럼 선택
  • filter(조건)으로 필터링
  • AND는 &, OR는 |, NOT은 ~
  • 조건마다 괄호로 감싸기
정답 보기
에디터 로딩 중...