Day 4: Python 함수를 Spark에서 쓰고 싶은데
Apache Spark: 대용량 데이터 처리의 시작 > Day 4: Python 함수를 Spark에서 쓰고 싶은데
Q1. Python UDF가 느린 이유는?
Q2. Pandas UDF가 Python UDF보다 빠른 이유는?
Q3. UDF에서 None 처리를 안 하면 발생하는 문제는?
Q4. UDF 내에서 외부 API를 호출하면 안 되는 이유는?
Q5. UDF 사용 시 가장 먼저 확인해야 할 것은?