🏆35

Challenge: 임베딩 모델 비교 실험

Day 2: 임베딩 & 벡터 DB

요구사항

2가지 임베딩 모델 비교

정확도, 속도, 비용 측정

결과 리포트 작성

평가 기준
  • 실험 설계 완성도
  • 측정 정확성
  • 결과 분석 품질
보너스
  • 3번째 모델 추가 (BGE-m3 등)
  • 다양한 언어 테스트

Challenge: 임베딩 모델 성능 비교

미션

2가지 임베딩 모델을 비교 실험하세요.

  1. OpenAI text-embedding-3-small (1536차원, 유료)
  2. Sentence-BERT all-MiniLM-L6-v2 (384차원, 무료)

테스트 데이터

에디터 로딩 중...

측정 지표

  1. 정확도: 정답 문서를 top-1에서 찾은 비율
  2. 속도: 임베딩 생성 시간
  3. 비용: 1만건 기준 예상 비용

Sentence-BERT 사용법

에디터 로딩 중...

제출물

  1. 실험 코드
  2. 결과 비교표
  3. 추천 의견 (어떤 상황에 어떤 모델?)
힌트 보기
Sentence-BERT: pip install sentence-transformers
정확도 = (top-1 정답 개수) / 전체 테스트 개수
time.time()으로 속도 측정