25분
SELECT & WHERE: 컬럼 선택과 필터링
Day 2: SQL 잘하면 Spark도 잘한다
SELECT & WHERE: 컬럼 선택과 필터링
Apache Spark: 대용량 데이터 처리의 시작 > Day 2: SQL 잘하면 Spark도 잘한다
학습 목표
select()로 원하는 컬럼을 선택할 수 있다 filter()로 조건에 맞는 row를 필터링할 수 있다
SQL ↔ Spark 변환
SQL:
에디터 로딩 중...
Spark:
에디터 로딩 중...
컬럼 참조 방법 3가지
에디터 로딩 중...
권장: col() 함수 사용 (가장 명시적)
필터 조건 작성법
에디터 로딩 중...
주의: & | ~ 사용 시 괄호 필수!
에디터 로딩 중...
힌트 보기
- • select("col1", "col2")로 컬럼 선택
- • filter(조건)으로 필터링
- • AND는 &, OR는 |, NOT은 ~
- • 조건마다 괄호로 감싸기
정답 보기
에디터 로딩 중...