🏆30

Day 4 챌린지: ETL 파이프라인

APOC 라이브러리 활용

학습 목표

APOC으로 ETL 파이프라인 구축 대용량 데이터 안전하게 처리 텍스트 정제 자동화

요구사항

JSON 파일에서 상품 100개 로드 (태그 포함)

고객 이름/이메일 정규화 (배치 처리)

유사 상품명 그룹핑 (Levenshtein)

월별 매출 집계 쿼리

전체 데이터 Cypher 스크립트로 Export

평가 기준
  • APOC 함수 적절한 선택 (30%)
  • 배치 처리 설정 최적화 (25%)
  • 에러 핸들링 (25%)
  • 코드 가독성 (20%)
보너스
  • apoc.load.jdbc로 MySQL 데이터 연동
  • 실시간 진행 상황 로깅
  • apoc.path.expand로 추천 시스템