▶️35분
Microsoft GraphRAG: 자동 KG 구축의 혁신
Microsoft GraphRAG & LlamaIndex
Microsoft GraphRAG: 자동 KG 구축의 혁신
GraphRAG > Microsoft GraphRAG & LlamaIndex
학습 목표
MS GraphRAG: 문서에서 KG 자동 구축 (LLM 기반) Community Detection: Leiden 알고리즘으로 밀접한 엔티티 그룹화 Community Summary: 각 커뮤니티에 대한 LLM 요약 보고서
▶️
영상 준비 중
35분
Microsoft GraphRAG: 자동 KG 구축의 혁신
Hook: KG 구축의 어려움
"GraphRAG가 좋은 건 알겠는데, Knowledge Graph는 어디서 구해요?"
기존 방식:
- 도메인 전문가가 스키마 설계 (몇 주)
- 수동으로 엔티티/관계 정의 (몇 달)
- 데이터 입력 및 검증 (계속...)
Microsoft GraphRAG:
- 문서 던지기
- LLM이 자동으로 KG 구축
- 끝.
문서만 있으면 Knowledge Graph가 자동 생성됩니다.
논문: "From Local to Global: A Graph RAG Approach to Query-Focused Summarization" (Microsoft Research, 2024)
왜 배우는가?
Microsoft GraphRAG가 해결하는 문제
| 기존 방식 | MS GraphRAG |
|---|---|
| 스키마 설계 필요 | 자동 엔티티 유형 발견 |
| 수동 엔티티 추출 | LLM 기반 자동 추출 |
| 관계 정의 필요 | 문맥에서 자동 추론 |
| 지역적 검색만 | Local + Global 검색 |
| 전체 요약 불가 | Community Summary로 전체 요약 |
핵심 혁신 1: Community Detection
에디터 로딩 중...
Community = 밀접하게 연결된 엔티티 그룹
예: "반도체 기업 커뮤니티" = {삼성전자, SK하이닉스, TSMC, Intel}
핵심 혁신 2: Community Summary
Community Summary는 각 커뮤니티(밀접 연결 엔티티 그룹)에 대해 LLM이 자동으로 생성하는 요약 보고서입니다.
에디터 로딩 중...
왜 중요한가?
- "반도체 시장의 전체 상황은?" 같은 글로벌 질문에 답변 가능
- 기존 RAG는 청크 단위 검색만 가능 → 전체 조망 불가
- Community Summary가 있으면 문서 전체를 읽은 것과 같은 효과
핵심 혁신 3: Map-Reduce 패턴 (Global Search)
Global Search는 Map-Reduce 패턴으로 동작합니다:
에디터 로딩 중...
Map-Reduce가 필요한 이유:
- 커뮤니티가 수십~수백 개일 수 있음
- 모든 요약을 한 번에 LLM 컨텍스트에 넣을 수 없음
- 각 커뮤니티를 독립적으로 평가(Map) → 결과 종합(Reduce)
| 단계 | 입력 | 출력 | LLM 호출 |
|---|---|---|---|
| Map | 커뮤니티 요약 + 질문 | 관련성 점수 + 부분 답변 | N회 (커뮤니티 수) |
| Reduce | 부분 답변 모음 | 최종 종합 답변 | 1회 |
핵심 개념
Local Search vs Global Search
| 검색 유형 | 질문 예시 | 검색 대상 | 메커니즘 |
|---|---|---|---|
| Local | "삼성전자의 경쟁사는?" | 특정 엔티티 주변 | 엔티티 → 이웃 탐색 → 관련 청크 |
| Global | "반도체 시장 전체 트렌드는?" | 커뮤니티 요약 | Map-Reduce로 요약 종합 |
| DRIFT | "최근 AI 칩 동향?" | Local + Global 혼합 | 적응형 검색 (v2 추가) |
Local Search 동작 상세
에디터 로딩 중...
Global Search 동작 상세 (Map-Reduce)
에디터 로딩 중...
Global Search = 전체를 조망하는 질문에 강력
Leiden 알고리즘과 계층적 커뮤니티
MS GraphRAG는 Leiden 알고리즘으로 커뮤니티를 탐지합니다:
에디터 로딩 중...
- 레벨이 높을수록 세부적, 레벨이 낮을수록 포괄적
- Global Search 시 적절한 레벨 선택이 중요
핵심 포인트
- • MS GraphRAG: 문서에서 KG 자동 구축 (LLM 기반)
- • Community Detection: Leiden 알고리즘으로 밀접한 엔티티 그룹화
- • Community Summary: 각 커뮤니티에 대한 LLM 요약 보고서
- • Local Search: 특정 엔티티 중심 검색 (이웃 탐색)
- • Global Search: Map-Reduce 패턴으로 커뮤니티 요약 종합
- • 계층적 커뮤니티로 다양한 추상화 수준 지원