Day 1: pandas로 10GB 처리하다 포기했다
Apache Spark: 대용량 데이터 처리의 시작 > Day 1: pandas로 10GB 처리하다 포기했다
Q1. pandas가 10GB 파일 처리에 실패하는 주된 이유는?
Q2. Spark에서 실제 데이터 처리를 담당하는 컴포넌트는?
Q3. 다음 중 Action이 아닌 것은?
Q4. Lazy Evaluation의 장점이 아닌 것은?
Q5. 대용량 DataFrame을 pandas로 변환하면 안 되는 이유는?