40

GraphRAG 아키텍처 패턴 4가지

GraphRAG 개론

학습 목표

Naive: 벡터 검색 + 그래프 보강 (가장 단순, 점진적 도입) Graph-First: 그래프 우선 -> 벡터 보완 (관계 질문에 강함) Hybrid: 병렬 검색 + RRF 융합 (범용성 높음)

GraphRAG 아키텍처 패턴 4가지

GraphRAG를 구현하는 방법은 여러 가지입니다. 어떤 패턴을 선택하느냐에 따라 성능, 비용, 복잡도가 달라집니다.

에디터 로딩 중...

왜 배우는가?

왜 여러 패턴이 존재하는가?

모든 질문이 같은 방식으로 답변되지 않습니다:

  • "삼성전자가 뭐하는 회사야?" -> 텍스트 검색이 더 적합
  • "삼성전자의 경쟁사는?" -> 그래프 검색이 더 적합
  • "반도체 시장 전체 트렌드는?" -> 글로벌 요약이 필요

패턴 선택 = 질문 유형에 맞는 검색 전략

질문 유형 분류표

질문 유형예시필요한 능력최적 패턴
사실 확인"X가 뭐야?"텍스트 매칭Naive
관계 질문"X와 Y의 관계?"관계 탐색Graph-First
복합 질문"X의 경쟁사의 최근 동향?"관계 + 텍스트Hybrid
요약 질문"전체 시장 트렌드?"글로벌 컨텍스트MS GraphRAG
비교 질문"X vs Y 장단점?"구조화된 속성 비교Hybrid

핵심 개념

패턴 1: Naive GraphRAG

가장 간단한 방식. 벡터 검색 결과에 그래프 정보를 추가합니다.

에디터 로딩 중...
에디터 로딩 중...

장점: 기존 RAG에 쉽게 추가 가능 (점진적 도입) 단점: 엔티티 추출 실패 시 그래프 활용 불가 적합: 기존 Vector RAG 시스템을 개선하고 싶을 때


패턴 2: Graph-First GraphRAG

그래프 검색을 우선으로 하고, 벡터 검색으로 보완합니다.

에디터 로딩 중...
에디터 로딩 중...

장점: 관계 중심 질문에 강함, 멀티홉 추론 가능 단점: 엔티티가 명확하지 않은 질문에 약함 적합: 기업 내부 지식베이스, 인물/조직 관계 분석


패턴 3: Hybrid GraphRAG

두 검색을 병렬로 수행하고 결과를 융합합니다.

에디터 로딩 중...
에디터 로딩 중...

장점: 범용성 높음, 두 방식의 장점 결합 단점: 복잡도 높음, 융합 전략(RRF, 가중합) 튜닝 필요 적합: 다양한 질문 유형을 처리하는 범용 Q&A 시스템


패턴 4: Microsoft GraphRAG

문서로부터 Knowledge Graph를 자동 구축하는 접근법입니다. 2024년 Microsoft Research에서 발표하여 큰 주목을 받았습니다.

에디터 로딩 중...

Local vs Global Search 비교

Local SearchGlobal Search
질문 유형"X의 경쟁사는?""반도체 시장 전체 동향은?"
검색 대상특정 엔티티 주변 서브그래프커뮤니티 요약 전체
장점정확한 관계 답변전체 요약/트렌드 파악
비용낮음높음 (모든 커뮤니티 요약 사용)

장점: KG가 없어도 문서만으로 구축 가능, 글로벌 질문 지원 단점: 인덱싱 비용 높음 (LLM 호출 수백~수천 회), 지연 시간 적합: 대규모 비정형 문서 분석 (보고서, 논문, 뉴스 아카이브)


패턴 선택 가이드

상황권장 패턴이유
기존 RAG에 그래프 추가Naive최소 변경으로 개선
명확한 엔티티 중심 질문Graph-First관계 탐색 효율적
범용 Q&A 시스템Hybrid질문 유형 무관 대응
KG 없이 대규모 문서 분석MS GraphRAG자동 KG + 요약
이미 Neo4j KG 보유Graph-First or Hybrid기존 KG 활용
토큰 비용 최소화Naive or Graph-FirstLLM 호출 최소
핵심 포인트
  • Naive: 벡터 검색 + 그래프 보강 (가장 단순, 점진적 도입)
  • Graph-First: 그래프 우선 -> 벡터 보완 (관계 질문에 강함)
  • Hybrid: 병렬 검색 + RRF 융합 (범용성 높음)
  • MS GraphRAG: 자동 KG 구축 + Community 기반 (글로벌 질문 지원)
  • 패턴 선택은 질문 유형, 기존 인프라, 비용에 따라 결정