25

How: Re-ranking으로 정확도 10% 향상

Day 3: 청킹 전략 & 검색 최적화

학습 목표

Re-ranking의 원리를 이해한다 Cross-Encoder와 Bi-Encoder의 차이를 안다 MMR의 역할을 이해한다

Re-ranking이란?

에디터 로딩 중...

효과: 정확도 10-15% 향상


Cross-Encoder vs Bi-Encoder

에디터 로딩 중...

주요 Re-ranker

모델크기비용한국어
ms-marco-MiniLM23MB무료OK
BGE-reranker1.1GB무료Good
Cohere RerankAPI유료Best
flashrank50MB무료OK

실무 팁: 로컬이면 flashrank, 품질 중시면 Cohere


Re-ranking 구현

에디터 로딩 중...

MMR (Maximal Marginal Relevance)

문제: 검색 결과가 너무 비슷함

에디터 로딩 중...

MMR 해결:

에디터 로딩 중...
에디터 로딩 중...
핵심 포인트
  • Re-ranking: 1차 검색 후 Cross-Encoder로 정밀 재정렬
  • Cross-Encoder: 쿼리-문서 상호작용 고려 (정확)
  • MMR: 관련성 + 다양성 균형 (중복 결과 방지)