▶️35

Microsoft GraphRAG: 자동 KG 구축의 혁신

Microsoft GraphRAG & LlamaIndex

학습 목표

MS GraphRAG: 문서에서 KG 자동 구축 (LLM 기반) Community Detection: Leiden 알고리즘으로 밀접한 엔티티 그룹화 Community Summary: 각 커뮤니티에 대한 LLM 요약 보고서

▶️

영상 준비 중

35

Microsoft GraphRAG: 자동 KG 구축의 혁신

Hook: KG 구축의 어려움

"GraphRAG가 좋은 건 알겠는데, Knowledge Graph는 어디서 구해요?"

기존 방식:

  1. 도메인 전문가가 스키마 설계 (몇 주)
  2. 수동으로 엔티티/관계 정의 (몇 달)
  3. 데이터 입력 및 검증 (계속...)

Microsoft GraphRAG:

  1. 문서 던지기
  2. LLM이 자동으로 KG 구축
  3. 끝.

문서만 있으면 Knowledge Graph가 자동 생성됩니다.

논문: "From Local to Global: A Graph RAG Approach to Query-Focused Summarization" (Microsoft Research, 2024)


왜 배우는가?

Microsoft GraphRAG가 해결하는 문제

기존 방식MS GraphRAG
스키마 설계 필요자동 엔티티 유형 발견
수동 엔티티 추출LLM 기반 자동 추출
관계 정의 필요문맥에서 자동 추론
지역적 검색만Local + Global 검색
전체 요약 불가Community Summary로 전체 요약

핵심 혁신 1: Community Detection

에디터 로딩 중...

Community = 밀접하게 연결된 엔티티 그룹

예: "반도체 기업 커뮤니티" = {삼성전자, SK하이닉스, TSMC, Intel}

핵심 혁신 2: Community Summary

Community Summary는 각 커뮤니티(밀접 연결 엔티티 그룹)에 대해 LLM이 자동으로 생성하는 요약 보고서입니다.

에디터 로딩 중...

왜 중요한가?

  • "반도체 시장의 전체 상황은?" 같은 글로벌 질문에 답변 가능
  • 기존 RAG는 청크 단위 검색만 가능 → 전체 조망 불가
  • Community Summary가 있으면 문서 전체를 읽은 것과 같은 효과

핵심 혁신 3: Map-Reduce 패턴 (Global Search)

Global Search는 Map-Reduce 패턴으로 동작합니다:

에디터 로딩 중...

Map-Reduce가 필요한 이유:

  • 커뮤니티가 수십~수백 개일 수 있음
  • 모든 요약을 한 번에 LLM 컨텍스트에 넣을 수 없음
  • 각 커뮤니티를 독립적으로 평가(Map) → 결과 종합(Reduce)
단계입력출력LLM 호출
Map커뮤니티 요약 + 질문관련성 점수 + 부분 답변N회 (커뮤니티 수)
Reduce부분 답변 모음최종 종합 답변1회

핵심 개념

Local Search vs Global Search

검색 유형질문 예시검색 대상메커니즘
Local"삼성전자의 경쟁사는?"특정 엔티티 주변엔티티 → 이웃 탐색 → 관련 청크
Global"반도체 시장 전체 트렌드는?"커뮤니티 요약Map-Reduce로 요약 종합
DRIFT"최근 AI 칩 동향?"Local + Global 혼합적응형 검색 (v2 추가)

Local Search 동작 상세

에디터 로딩 중...

Global Search 동작 상세 (Map-Reduce)

에디터 로딩 중...

Global Search = 전체를 조망하는 질문에 강력

Leiden 알고리즘과 계층적 커뮤니티

MS GraphRAG는 Leiden 알고리즘으로 커뮤니티를 탐지합니다:

에디터 로딩 중...
  • 레벨이 높을수록 세부적, 레벨이 낮을수록 포괄적
  • Global Search 시 적절한 레벨 선택이 중요
핵심 포인트
  • MS GraphRAG: 문서에서 KG 자동 구축 (LLM 기반)
  • Community Detection: Leiden 알고리즘으로 밀접한 엔티티 그룹화
  • Community Summary: 각 커뮤니티에 대한 LLM 요약 보고서
  • Local Search: 특정 엔티티 중심 검색 (이웃 탐색)
  • Global Search: Map-Reduce 패턴으로 커뮤니티 요약 종합
  • 계층적 커뮤니티로 다양한 추상화 수준 지원