55

실습: Microsoft GraphRAG 파이프라인

Microsoft GraphRAG & LlamaIndex

학습 목표

graphrag init -> 문서 추가 -> graphrag index -> graphrag query settings.yaml에서 LLM, 청크 크기, 검색 설정 출력물: entities, relationships, communities, community_reports (parquet)

Microsoft GraphRAG 실습

MS GraphRAG를 직접 실행하여 문서에서 Knowledge Graph를 자동 구축해봅니다.

CLI와 Python API 두 가지 방식을 모두 다룹니다.


왜 배우는가?

MS GraphRAG 설치

에디터 로딩 중...

프로젝트 구조

에디터 로딩 중...

인덱싱 파이프라인 단계별 이해

에디터 로딩 중...

구현 방법

Step 1: 프로젝트 초기화

에디터 로딩 중...

Step 2: 문서 준비

에디터 로딩 중...

Step 3: 설정 파일 수정

에디터 로딩 중...

설정 파라미터 상세 가이드

파라미터기본값설명비용 영향
chunks.size1200청크 크기 (토큰)작을수록 LLM 호출 증가
chunks.overlap100청크 겹침클수록 중복 추출
max_gleanings1추가 추출 반복1회 추가당 비용 2배
community_reports.max_length2000요약 길이길수록 토큰 비용 증가
text_unit_prop0.5Local Search 텍스트 비율-
community_prop0.1Local Search 커뮤니티 비율-

Step 4: 인덱싱 (KG 구축)

에디터 로딩 중...

Step 5: 쿼리 실행

에디터 로딩 중...

Step 6: 생성된 KG 확인

에디터 로딩 중...

Step 7: Python API로 프로그래밍 방식 사용

에디터 로딩 중...

자주 하는 실수

자주 하는 실수

1. API 키 미설정

에디터 로딩 중...

2. 문서 형식 오류

에디터 로딩 중...

3. 인덱싱 비용 과다

에디터 로딩 중...

4. Global Search 결과가 빈약한 경우

에디터 로딩 중...

5. 한국어 문서에서 엔티티 추출 품질 저하

에디터 로딩 중...
에디터 로딩 중...