35분
KG 확장 패턴: 수백만 → 수십억 노드
스키마 진화 & 프로덕션 운영
KG 확장 패턴: 수백만 → 수십억 노드
KG 생명주기 & 엔터프라이즈 활용 > 스키마 진화 & 프로덕션 운영
학습 목표
대규모 KG의 확장 전략과 최적화 기법을 이해한다
KG 확장 패턴: 수백만 → 수십억 노드
학습 목표
- 대규모 KG의 확장 전략과 최적화 기법을 이해한다
규모별 운영 전략
| 규모 | 노드 수 | 권장 아키텍처 | 주요 과제 |
|---|---|---|---|
| Small | <100만 | 단일 서버 | 없음 |
| Medium | 100만~1억 | 서버 최적화 | 인덱스, 쿼리 튜닝 |
| Large | 1억~10억 | 클러스터 | 샤딩, 페더레이션 |
| Huge | 10억+ | 분산 시스템 | 데이터 파티셔닝 |
1. 인덱스 최적화
에디터 로딩 중...
2. APOC Batch Processing
에디터 로딩 중...
3. Neo4j Fabric (페더레이션)
에디터 로딩 중...
4. 쿼리 최적화 팁
| 패턴 | Bad | Good |
|---|---|---|
| 레이블 필터링 | MATCH (n) WHERE ... | MATCH (n:Person) WHERE ... |
| 속성 룩업 | WHERE n.name = 'Alice' (인덱스 없이) | 인덱스 생성 후 사용 |
| 전체 경로 | *..10 (범위 넓음) | *..3 (최소 범위) |
| OPTIONAL MATCH | 불필요한 OPTIONAL | 필요한 경우만 사용 |
| RETURN * | 모든 필드 반환 | 필요한 필드만 RETURN |
핵심 포인트
- • 규모별 전략: Small(단일)→Medium(최적화)→Large(클러스터)→Huge(분산)
- • 인덱스: 단일, 복합, Full-Text 인덱스로 쿼리 성능 보장
- • APOC periodic.iterate: 대량 처리를 배치로 분할 (OOM 방지)
- • Neo4j Fabric: 다중 DB 페더레이션 쿼리
- • 쿼리 최적화: 레이블 명시, 인덱스 활용, 최소 범위 탐색