10

Day 2 점검

Day 2: SQL 잘하면 Spark도 잘한다

5문제

Q1. Spark에서 가장 권장되는 파일 포맷은?

Q2. df.filter((col("age") > 25) | (col("city") == "서울"))에서 |의 의미는?

Q3. left_anti join의 결과는?

Q4. broadcast join을 사용해야 하는 상황은?

Q5. rank()와 row_number()의 차이는?