전체 커리큘럼
Phase 12개월
데이터 엔지니어링 + AI 도구
Python, SQL, Spark, Airflow + Copilot/Claude로 AI-Native 개발
8코스
118시간 50분총 학습 시간
학습 코스
Week 1
Python 고급: 제너레이터, 데코레이터, 컨텍스트 매니저, Type Hints
로깅 & 캐싱 시스템
제너레이터데코레이터컨텍스트 매니저+2
5 모듈
44 레슨
13시간 5분
Week 2
pandas 고급 & 대용량 데이터 처리
NYC Yellow Taxi 1GB 데이터 분석
청크 처리와 dtype 최적화MultiIndex와 피벗 테이블벡터화와 성능 최적화+2
5 모듈
46 레슨
14시간 55분
Week 3
SQL 고급 - 윈도우 함수와 성능 최적화
이커머스 데이터 분석 대시보드
윈도우 함수 (ROW_NUMBER, RANK, DENSE_RANK)LAG, LEAD, 프레임CTE와 재귀 쿼리+2
5 모듈
40 레슨
15시간 40분
Week 4
데이터 모델링
이커머스 데이터 웨어하우스 설계
정규화Star SchemaDimension/Fact+3
5 모듈
39 레슨
15시간 10분
Week 5
Apache Spark: 대용량 데이터 처리의 시작
대용량 웹 로그 분석 파이프라인
Spark 아키텍처DataFrame APICatalyst Optimizer+2
5 모듈
36 레슨
15시간 40분
Week 6
Spark 심화: Streaming & Delta Lake
실시간 이커머스 파이프라인
Structured StreamingDelta LakePerformance Tuning+2
5 모듈
34 레슨
14시간 40분
Week 7
Apache Airflow - 워크플로우 오케스트레이션
Production ETL Pipeline
DAGOperatorTaskFlow API+3
5 모듈
35 레슨
12시간 25분
Week 8
Phase 1 캡스톤: E2E 데이터 파이프라인
SaaS 분석 플랫폼 E2E 파이프라인 구축
프로젝트 설계데이터 수집 (Extract)데이터 변환 (Transform)+3
5 모듈
35 레슨
17시간 15분