35

LightRAG & fast-graphrag: 차세대 경량 GraphRAG

Microsoft GraphRAG & LlamaIndex

학습 목표

LightRAG: MS GraphRAG 비용 1/100, 쿼리당 100-500 토큰 fast-graphrag: Personalized PageRank, 검색 27배 빠름 의사결정 트리: 비용→LightRAG, 정확도→MS, 속도→fast-graphrag

LightRAG & fast-graphrag: 차세대 경량 GraphRAG

Hook: MS GraphRAG의 비용 청구서

"50개 금융 뉴스 문서로 MS GraphRAG를 돌렸습니다."

  • 인덱싱 시간: 18분 32초
  • 비용: $11.77 (GPT-4 토큰)
  • 1GB 문서라면? $50+ 예상

같은 결과를 1/100 비용에, 27배 빠르게 얻을 수 있다면?


왜 배우는가?

왜 대안 프레임워크가 필요한가?

MS GraphRAG는 정확도는 최고지만:

  • Leiden 커뮤니티 탐지 + 계층적 요약 → 인덱싱 비용 폭발
  • Global Search 시 모든 커뮤니티 요약 → 쿼리당 비용 높음
  • 대규모 문서에서는 비현실적
프레임워크출시핵심 혁신
MS GraphRAG2024.07Leiden + 커뮤니티 요약
LightRAG2024.10서브그래프 추출, 1/100 비용
fast-graphrag2024.11Personalized PageRank, 27배 속도
nano-graphrag2024.09교육용, 전체 1100줄

핵심 개념

프레임워크 심층 비교

LightRAG — 극한의 비용 효율

에디터 로딩 중...

특징:

  • 인덱싱 비용: $0.50-2 (GPT-3.5) → MS의 1/10~1/100
  • 쿼리당 토큰: 100-500개 → 단일 API 호출
  • 속도: 0.5-2초
에디터 로딩 중...
에디터 로딩 중...

fast-graphrag — 극한의 속도

에디터 로딩 중...

성능 지표:

  • 인덱싱 비용: $0.08/1MB (MS의 1/6)
  • 검색 속도: 0.4초 (MS의 3.2초 → 27배)
  • 정확도: MS 대비 95% 수준
에디터 로딩 중...

nano-graphrag — 교육용 미니멀

전체 코드 1100줄로 GraphRAG 동작 원리를 이해할 수 있는 교육용 프레임워크. 프로덕션 부적합하지만, 내부 구조 학습에 최적.

3개 프레임워크 벤치마크 (50개 금융 뉴스)

지표MS GraphRAGLightRAGfast-graphrag
인덱싱 시간18m 32s2m 15s3m 40s
인덱싱 비용$11.77$1.20$2.05
쿼리 속도3.2초0.8초0.4초
정확도⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
Global Search✅ (최강)⚠️ (제한적)⚠️ (제한적)
커스텀 온톨로지

의사결정 트리

에디터 로딩 중...

실무 2단계 전략

에디터 로딩 중...

핵심: 프레임워크 선택은 기술 문제가 아니라 비즈니스 우선순위(비용/시간/정확도) 문제.


자주 하는 실수

자주 하는 실수

1. "MS GraphRAG가 최고니까 무조건"

에디터 로딩 중...

2. LightRAG Global Search 과신

에디터 로딩 중...

3. 벤치마크 없이 마이그레이션

에디터 로딩 중...
핵심 포인트
  • LightRAG: MS GraphRAG 비용 1/100, 쿼리당 100-500 토큰
  • fast-graphrag: Personalized PageRank, 검색 27배 빠름
  • 의사결정 트리: 비용→LightRAG, 정확도→MS, 속도→fast-graphrag
  • 실무 전략: POC는 LlamaIndex → 프로덕션은 직접 구현