Day 3: 같은 코드가 10배 빨라지는 비밀
Apache Spark: 대용량 데이터 처리의 시작 > Day 3: 같은 코드가 10배 빨라지는 비밀
Q1. Catalyst Optimizer가 하지 않는 것은?
Q2. explain()에서 Exchange는 무엇을 의미하는가?
Q3. 다음 중 Shuffle이 발생하지 않는 연산은?
Q4. Python UDF 대신 사용해야 하는 것은?
Q5. Predicate Pushdown의 효과는?