🏆30분
Day 4 챌린지: ETL 파이프라인
APOC 라이브러리 활용
Day 4 챌린지: ETL 파이프라인
Cypher 심화 & 데이터 모델링 > APOC 라이브러리 활용
학습 목표
APOC으로 ETL 파이프라인 구축 대용량 데이터 안전하게 처리 텍스트 정제 자동화
요구사항
JSON 파일에서 상품 100개 로드 (태그 포함)
고객 이름/이메일 정규화 (배치 처리)
유사 상품명 그룹핑 (Levenshtein)
월별 매출 집계 쿼리
전체 데이터 Cypher 스크립트로 Export
평가 기준
- • APOC 함수 적절한 선택 (30%)
- • 배치 처리 설정 최적화 (25%)
- • 에러 핸들링 (25%)
- • 코드 가독성 (20%)
보너스
- • apoc.load.jdbc로 MySQL 데이터 연동
- • 실시간 진행 상황 로깅
- • apoc.path.expand로 추천 시스템