🏆35분
Challenge: 임베딩 모델 비교 실험
Day 2: 임베딩 & 벡터 DB
Challenge: 임베딩 모델 비교 실험
RAG 기초 > Day 2: 임베딩 & 벡터 DB
요구사항
2가지 임베딩 모델 비교
정확도, 속도, 비용 측정
결과 리포트 작성
평가 기준
- • 실험 설계 완성도
- • 측정 정확성
- • 결과 분석 품질
보너스
- • 3번째 모델 추가 (BGE-m3 등)
- • 다양한 언어 테스트
Challenge: 임베딩 모델 성능 비교
미션
2가지 임베딩 모델을 비교 실험하세요.
- OpenAI text-embedding-3-small (1536차원, 유료)
- Sentence-BERT all-MiniLM-L6-v2 (384차원, 무료)
테스트 데이터
에디터 로딩 중...
측정 지표
- 정확도: 정답 문서를 top-1에서 찾은 비율
- 속도: 임베딩 생성 시간
- 비용: 1만건 기준 예상 비용
Sentence-BERT 사용법
에디터 로딩 중...
제출물
- 실험 코드
- 결과 비교표
- 추천 의견 (어떤 상황에 어떤 모델?)
힌트 보기
Sentence-BERT: pip install sentence-transformers 정확도 = (top-1 정답 개수) / 전체 테스트 개수 time.time()으로 속도 측정