25분
How: Re-ranking으로 정확도 10% 향상
Day 3: 청킹 전략 & 검색 최적화
How: Re-ranking으로 정확도 10% 향상
RAG 기초 > Day 3: 청킹 전략 & 검색 최적화
학습 목표
Re-ranking의 원리를 이해한다 Cross-Encoder와 Bi-Encoder의 차이를 안다 MMR의 역할을 이해한다
Re-ranking이란?
에디터 로딩 중...
효과: 정확도 10-15% 향상
Cross-Encoder vs Bi-Encoder
에디터 로딩 중...
주요 Re-ranker
| 모델 | 크기 | 비용 | 한국어 |
|---|---|---|---|
| ms-marco-MiniLM | 23MB | 무료 | OK |
| BGE-reranker | 1.1GB | 무료 | Good |
| Cohere Rerank | API | 유료 | Best |
| flashrank | 50MB | 무료 | OK |
실무 팁: 로컬이면 flashrank, 품질 중시면 Cohere
Re-ranking 구현
에디터 로딩 중...
MMR (Maximal Marginal Relevance)
문제: 검색 결과가 너무 비슷함
에디터 로딩 중...
MMR 해결:
에디터 로딩 중...
에디터 로딩 중...
핵심 포인트
- • Re-ranking: 1차 검색 후 Cross-Encoder로 정밀 재정렬
- • Cross-Encoder: 쿼리-문서 상호작용 고려 (정확)
- • MMR: 관련성 + 다양성 균형 (중복 결과 방지)