40

실습: GraphRAG 품질 평가 - RAGAS 프레임워크

Weekly Project - GraphRAG 시스템

학습 목표

RAGAS: Faithfulness, Answer Relevancy, Context Precision, Context Recall 난이도 3단계: Easy(1-hop) / Medium(2-hop) / Hard(Multi-hop) GraphRAG 진가는 Hard 질문에서 발휘 (Vector 30% vs Graph 80%)

GraphRAG 품질 평가: RAGAS 프레임워크

프로젝트가 완성됐다면, 이제 "얼마나 잘 동작하는지" 증명해야 합니다.

에디터 로딩 중...

RAGAS(Retrieval-Augmented Generation Assessment) 프레임워크로 GraphRAG 품질을 체계적으로 평가합니다.


왜 배우는가?

RAGAS 4대 메트릭

메트릭측정 대상역할
Faithfulness답변이 검색 컨텍스트에 기반하는가환각 방지
Answer Relevancy답변이 질문에 적절한가답변 품질
Context Precision검색 결과가 정확한가검색 품질
Context Recall필요한 정보가 모두 검색되었는가검색 커버리지

질문 난이도 3단계

난이도예시Vector RAGGraphRAG차이
Easy (1-hop)"삼성전자 CEO는?"~95%~93%-2%
Medium (2-hop)"삼성 투자 기관은?"~70%~90%+20%
Hard (Multi-hop)"삼성 투자기관의 다른 투자처?"~30%~80%+50%

GraphRAG의 진가는 Hard 질문에서 발휘됩니다!

Multi-hop 추론 유형

유형설명예시
BridgeA→B→C 순차 탐색"삼성 투자자 → 투자자의 다른 투자"
Comparison엔티티 비교"삼성과 SK하이닉스의 공통 투자자"
Intersection교집합 탐색"반도체+AI 모두 관련된 기업"
Composition복합 관계"A의 경쟁사의 파트너사의 제품"

구현 방법

RAGAS 평가 구현

에디터 로딩 중...

Vector RAG vs GraphRAG 비교 평가

에디터 로딩 중...

교차 평가 (Evaluation Bias 방지)

에디터 로딩 중...

자주 하는 실수

자주 하는 실수

1. Hard 질문 누락

에디터 로딩 중...

2. 자기 평가 편향

에디터 로딩 중...

3. 기준선(Baseline) 없는 평가

에디터 로딩 중...
에디터 로딩 중...