Phase 1Week 6Spark

Spark DAG Visualizer

Apache Spark의 실행 원리를 시각적으로 이해하세요. DAG, Stage, Task의 개념과 Narrow/Wide Transformation의 차이점을 직접 확인할 수 있습니다.

🔀

RDD Lineage와 Lazy Evaluation

📊

Wide vs Narrow Transformation

⚡

병렬 처리와 파티셔닝

💾

RDD 캐싱으로 성능 최적화

Spark Visualizer 로딩 중...

Apache Spark는 대용량 데이터 처리를 위한 통합 분석 엔진입니다. 인메모리 처리로 Hadoop MapReduce보다 최대 100배 빠른 성능을 제공합니다.

이 시뮬레이터는 FDE Academy Phase 1 Week 6 "Spark & 분산 처리" 과정의 실습 도구입니다. DAG 실행 원리를 직접 확인하며 학습하세요.

기본

텍스트 파일에서 단어별 빈도 계산

Join

두 RDD를 조인하는 예제

집계

그룹별 집계 연산

최적화

RDD 캐싱을 통한 반복 연산 최적화

비교

변환 유형별 성능 차이