55분
실습: Microsoft GraphRAG 파이프라인
Microsoft GraphRAG & LlamaIndex
실습: Microsoft GraphRAG 파이프라인
GraphRAG > Microsoft GraphRAG & LlamaIndex
학습 목표
graphrag init -> 문서 추가 -> graphrag index -> graphrag query settings.yaml에서 LLM, 청크 크기, 검색 설정 출력물: entities, relationships, communities, community_reports (parquet)
Microsoft GraphRAG 실습
MS GraphRAG를 직접 실행하여 문서에서 Knowledge Graph를 자동 구축해봅니다.
CLI와 Python API 두 가지 방식을 모두 다룹니다.
왜 배우는가?
MS GraphRAG 설치
에디터 로딩 중...
프로젝트 구조
에디터 로딩 중...
인덱싱 파이프라인 단계별 이해
에디터 로딩 중...
구현 방법
Step 1: 프로젝트 초기화
에디터 로딩 중...
Step 2: 문서 준비
에디터 로딩 중...
Step 3: 설정 파일 수정
에디터 로딩 중...
설정 파라미터 상세 가이드
| 파라미터 | 기본값 | 설명 | 비용 영향 |
|---|---|---|---|
| chunks.size | 1200 | 청크 크기 (토큰) | 작을수록 LLM 호출 증가 |
| chunks.overlap | 100 | 청크 겹침 | 클수록 중복 추출 |
| max_gleanings | 1 | 추가 추출 반복 | 1회 추가당 비용 2배 |
| community_reports.max_length | 2000 | 요약 길이 | 길수록 토큰 비용 증가 |
| text_unit_prop | 0.5 | Local Search 텍스트 비율 | - |
| community_prop | 0.1 | Local Search 커뮤니티 비율 | - |
Step 4: 인덱싱 (KG 구축)
에디터 로딩 중...
Step 5: 쿼리 실행
에디터 로딩 중...
Step 6: 생성된 KG 확인
에디터 로딩 중...
Step 7: Python API로 프로그래밍 방식 사용
에디터 로딩 중...
자주 하는 실수
자주 하는 실수
1. API 키 미설정
에디터 로딩 중...
2. 문서 형식 오류
에디터 로딩 중...
3. 인덱싱 비용 과다
에디터 로딩 중...
4. Global Search 결과가 빈약한 경우
에디터 로딩 중...
5. 한국어 문서에서 엔티티 추출 품질 저하
에디터 로딩 중...
에디터 로딩 중...