20분
Pitfall: RAG가 실패하는 5가지 이유
Day 1: RAG 아키텍처 개요
Pitfall: RAG가 실패하는 5가지 이유
RAG 기초 > Day 1: RAG 아키텍처 개요
학습 목표
RAG 실패의 주요 원인을 안다 각 문제의 해결 방향을 이해한다
RAG 실패 사례
"RAG 만들었는데 정확도가 30%밖에 안 나와요..."
RAG는 "만들기"는 쉽지만 "잘 만들기"는 어렵다. 대부분의 실패는 아래 5가지 중 하나다.
Pitfall 1: 임베딩 모델 불일치
에디터 로딩 중...
문제: 저장과 검색에 다른 임베딩 모델 사용 증상: 검색 결과가 완전히 엉뚱함 해결: 반드시 같은 모델 사용
에디터 로딩 중...
Pitfall 2: 청크 크기 부적절
에디터 로딩 중...
해결: 500~1000자가 적정 (도메인에 따라 조절)
Pitfall 3: 검색 결과 부족 (k가 너무 작음)
에디터 로딩 중...
해결: k=3~5로 시작, 필요시 조절
Pitfall 4: 프롬프트 부실
에디터 로딩 중...
Pitfall 5: 문서 품질 문제
에디터 로딩 중...
RAG 디버깅 체크리스트
| 순서 | 점검 항목 | 확인 방법 |
|---|---|---|
| 1 | 임베딩 모델 일치? | 저장/검색 코드에서 같은 모델 사용 확인 |
| 2 | 청크 크기 적절? | 검색 결과 출력해서 확인 |
| 3 | k 값 충분? | k를 늘려보고 결과 비교 |
| 4 | 프롬프트 명확? | LLM에게 역할, 조건, 형식 지정 |
| 5 | 문서 품질? | 원본 문서와 청크 내용 비교 |
80%의 RAG 문제는 검색 단계에서 발생합니다. LLM을 의심하기 전에 검색 결과부터 확인하세요!
핵심 포인트
- • 임베딩 모델: 저장/검색에 반드시 같은 모델
- • 청크 크기: 500~1000자가 적정
- • 검색 개수: k=3~5로 시작
- • 프롬프트: 역할, 조건, 형식 명시
- • 디버깅: 검색 결과부터 확인