40분
실습: GraphRAG 품질 평가 - RAGAS 프레임워크
Weekly Project - GraphRAG 시스템
실습: GraphRAG 품질 평가 - RAGAS 프레임워크
GraphRAG > Weekly Project - GraphRAG 시스템
학습 목표
RAGAS: Faithfulness, Answer Relevancy, Context Precision, Context Recall 난이도 3단계: Easy(1-hop) / Medium(2-hop) / Hard(Multi-hop) GraphRAG 진가는 Hard 질문에서 발휘 (Vector 30% vs Graph 80%)
GraphRAG 품질 평가: RAGAS 프레임워크
프로젝트가 완성됐다면, 이제 "얼마나 잘 동작하는지" 증명해야 합니다.
에디터 로딩 중...
RAGAS(Retrieval-Augmented Generation Assessment) 프레임워크로 GraphRAG 품질을 체계적으로 평가합니다.
왜 배우는가?
RAGAS 4대 메트릭
| 메트릭 | 측정 대상 | 역할 |
|---|---|---|
| Faithfulness | 답변이 검색 컨텍스트에 기반하는가 | 환각 방지 |
| Answer Relevancy | 답변이 질문에 적절한가 | 답변 품질 |
| Context Precision | 검색 결과가 정확한가 | 검색 품질 |
| Context Recall | 필요한 정보가 모두 검색되었는가 | 검색 커버리지 |
질문 난이도 3단계
| 난이도 | 예시 | Vector RAG | GraphRAG | 차이 |
|---|---|---|---|---|
| Easy (1-hop) | "삼성전자 CEO는?" | ~95% | ~93% | -2% |
| Medium (2-hop) | "삼성 투자 기관은?" | ~70% | ~90% | +20% |
| Hard (Multi-hop) | "삼성 투자기관의 다른 투자처?" | ~30% | ~80% | +50% |
GraphRAG의 진가는 Hard 질문에서 발휘됩니다!
Multi-hop 추론 유형
| 유형 | 설명 | 예시 |
|---|---|---|
| Bridge | A→B→C 순차 탐색 | "삼성 투자자 → 투자자의 다른 투자" |
| Comparison | 엔티티 비교 | "삼성과 SK하이닉스의 공통 투자자" |
| Intersection | 교집합 탐색 | "반도체+AI 모두 관련된 기업" |
| Composition | 복합 관계 | "A의 경쟁사의 파트너사의 제품" |
구현 방법
RAGAS 평가 구현
에디터 로딩 중...
Vector RAG vs GraphRAG 비교 평가
에디터 로딩 중...
교차 평가 (Evaluation Bias 방지)
에디터 로딩 중...
자주 하는 실수
자주 하는 실수
1. Hard 질문 누락
에디터 로딩 중...
2. 자기 평가 편향
에디터 로딩 중...
3. 기준선(Baseline) 없는 평가
에디터 로딩 중...
에디터 로딩 중...