20

Pitfall: RAG가 실패하는 5가지 이유

Day 1: RAG 아키텍처 개요

학습 목표

RAG 실패의 주요 원인을 안다 각 문제의 해결 방향을 이해한다

RAG 실패 사례

"RAG 만들었는데 정확도가 30%밖에 안 나와요..."

RAG는 "만들기"는 쉽지만 "잘 만들기"는 어렵다. 대부분의 실패는 아래 5가지 중 하나다.


Pitfall 1: 임베딩 모델 불일치

에디터 로딩 중...

문제: 저장과 검색에 다른 임베딩 모델 사용 증상: 검색 결과가 완전히 엉뚱함 해결: 반드시 같은 모델 사용

에디터 로딩 중...

Pitfall 2: 청크 크기 부적절

에디터 로딩 중...

해결: 500~1000자가 적정 (도메인에 따라 조절)


Pitfall 3: 검색 결과 부족 (k가 너무 작음)

에디터 로딩 중...

해결: k=3~5로 시작, 필요시 조절


Pitfall 4: 프롬프트 부실

에디터 로딩 중...

Pitfall 5: 문서 품질 문제

에디터 로딩 중...

RAG 디버깅 체크리스트

순서점검 항목확인 방법
1임베딩 모델 일치?저장/검색 코드에서 같은 모델 사용 확인
2청크 크기 적절?검색 결과 출력해서 확인
3k 값 충분?k를 늘려보고 결과 비교
4프롬프트 명확?LLM에게 역할, 조건, 형식 지정
5문서 품질?원본 문서와 청크 내용 비교

80%의 RAG 문제는 검색 단계에서 발생합니다. LLM을 의심하기 전에 검색 결과부터 확인하세요!

핵심 포인트
  • 임베딩 모델: 저장/검색에 반드시 같은 모델
  • 청크 크기: 500~1000자가 적정
  • 검색 개수: k=3~5로 시작
  • 프롬프트: 역할, 조건, 형식 명시
  • 디버깅: 검색 결과부터 확인