35분
LightRAG & fast-graphrag: 차세대 경량 GraphRAG
Microsoft GraphRAG & LlamaIndex
LightRAG & fast-graphrag: 차세대 경량 GraphRAG
GraphRAG > Microsoft GraphRAG & LlamaIndex
학습 목표
LightRAG: MS GraphRAG 비용 1/100, 쿼리당 100-500 토큰 fast-graphrag: Personalized PageRank, 검색 27배 빠름 의사결정 트리: 비용→LightRAG, 정확도→MS, 속도→fast-graphrag
LightRAG & fast-graphrag: 차세대 경량 GraphRAG
Hook: MS GraphRAG의 비용 청구서
"50개 금융 뉴스 문서로 MS GraphRAG를 돌렸습니다."
- 인덱싱 시간: 18분 32초
- 비용: $11.77 (GPT-4 토큰)
- 1GB 문서라면? $50+ 예상
같은 결과를 1/100 비용에, 27배 빠르게 얻을 수 있다면?
왜 배우는가?
왜 대안 프레임워크가 필요한가?
MS GraphRAG는 정확도는 최고지만:
- Leiden 커뮤니티 탐지 + 계층적 요약 → 인덱싱 비용 폭발
- Global Search 시 모든 커뮤니티 요약 → 쿼리당 비용 높음
- 대규모 문서에서는 비현실적
| 프레임워크 | 출시 | 핵심 혁신 |
|---|---|---|
| MS GraphRAG | 2024.07 | Leiden + 커뮤니티 요약 |
| LightRAG | 2024.10 | 서브그래프 추출, 1/100 비용 |
| fast-graphrag | 2024.11 | Personalized PageRank, 27배 속도 |
| nano-graphrag | 2024.09 | 교육용, 전체 1100줄 |
핵심 개념
프레임워크 심층 비교
LightRAG — 극한의 비용 효율
에디터 로딩 중...
특징:
- 인덱싱 비용: $0.50-2 (GPT-3.5) → MS의 1/10~1/100
- 쿼리당 토큰: 100-500개 → 단일 API 호출
- 속도: 0.5-2초
에디터 로딩 중...
에디터 로딩 중...
fast-graphrag — 극한의 속도
에디터 로딩 중...
성능 지표:
- 인덱싱 비용: $0.08/1MB (MS의 1/6)
- 검색 속도: 0.4초 (MS의 3.2초 → 27배)
- 정확도: MS 대비 95% 수준
에디터 로딩 중...
nano-graphrag — 교육용 미니멀
전체 코드 1100줄로 GraphRAG 동작 원리를 이해할 수 있는 교육용 프레임워크. 프로덕션 부적합하지만, 내부 구조 학습에 최적.
3개 프레임워크 벤치마크 (50개 금융 뉴스)
| 지표 | MS GraphRAG | LightRAG | fast-graphrag |
|---|---|---|---|
| 인덱싱 시간 | 18m 32s | 2m 15s | 3m 40s |
| 인덱싱 비용 | $11.77 | $1.20 | $2.05 |
| 쿼리 속도 | 3.2초 | 0.8초 | 0.4초 |
| 정확도 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ |
| Global Search | ✅ (최강) | ⚠️ (제한적) | ⚠️ (제한적) |
| 커스텀 온톨로지 | ❌ | ❌ | ❌ |
의사결정 트리
에디터 로딩 중...
실무 2단계 전략
에디터 로딩 중...
핵심: 프레임워크 선택은 기술 문제가 아니라 비즈니스 우선순위(비용/시간/정확도) 문제.
자주 하는 실수
자주 하는 실수
1. "MS GraphRAG가 최고니까 무조건"
에디터 로딩 중...
2. LightRAG Global Search 과신
에디터 로딩 중...
3. 벤치마크 없이 마이그레이션
에디터 로딩 중...
핵심 포인트
- • LightRAG: MS GraphRAG 비용 1/100, 쿼리당 100-500 토큰
- • fast-graphrag: Personalized PageRank, 검색 27배 빠름
- • 의사결정 트리: 비용→LightRAG, 정확도→MS, 속도→fast-graphrag
- • 실무 전략: POC는 LlamaIndex → 프로덕션은 직접 구현