Day 2: SQL 잘하면 Spark도 잘한다
Apache Spark: 대용량 데이터 처리의 시작 > Day 2: SQL 잘하면 Spark도 잘한다
Q1. Spark에서 가장 권장되는 파일 포맷은?
Q2. df.filter((col("age") > 25) | (col("city") == "서울"))에서 |의 의미는?
Q3. left_anti join의 결과는?
Q4. broadcast join을 사용해야 하는 상황은?
Q5. rank()와 row_number()의 차이는?