커리큘럼으로 돌아가기

Phase 18주 과정

데이터 엔지니어링 기초

Python, SQL, Spark, Airflow를 활용한 데이터 파이프라인 구축

Python 심화

데코레이터 기반 로깅 & 캐싱 시스템

제너레이터 & 이터레이터데코레이터 패턴컨텍스트 매니저Type Hints & mypy

5일 학습학습 시작

pandas & 데이터 처리

NYC Taxi 1GB+ 데이터 분석 파이프라인

대용량 데이터 처리MultiIndex & Pivot성능 최적화Polars

5일 학습학습 시작

SQL 심화

SQL 분석 쿼리 20개 작성

윈도우 함수CTE & 재귀 쿼리실행 계획 분석쿼리 튜닝

5일 학습학습 시작

데이터 모델링

이커머스 데이터 웨어하우스 설계 프로젝트

정규화Star/Snowflake 스키마SCDERD 설계

5일 학습학습 시작

Apache Spark

대용량 로그 분석 파이프라인 구축

Spark 아키텍처DataFrame APICatalyst OptimizerUDF & Pandas UDF

5일 학습학습 시작

Spark 심화 & Delta Lake

실시간 주문 처리 파이프라인 구축

Structured StreamingDelta Lake성능 튜닝Spark UI

5일 학습학습 시작

Apache Airflow

ETL 워크플로우 자동화 시스템 구축

DAG 설계Operators스케줄링에러 핸들링모니터링

5일 학습학습 시작

E2E 데이터 파이프라인

Phase 1 캡스톤: SaaS 분석 플랫폼 E2E 파이프라인 구축

프로젝트 설계데이터 수집Spark 변환Airflow 오케스트레이션테스트 & 배포

5일 학습학습 시작

Phase 1 요약

총 학습 기간

8주

총 학습 시간

97시간 30분

일일 학습

40일

주요 토픽

34개