20

Why: 스키마 주입이 정확도를 바꾼다

Day 2: 프롬프트 엔지니어링

학습 목표

스키마 주입의 효과를 이해한다 효과적인 스키마 포맷을 설계할 수 있다

스키마 없이 vs 스키마 있이

스키마 없이

에디터 로딩 중...

LLM 생성:

에디터 로딩 중...

문제점:

  • Organization (X) → Company (O)
  • Samsung Electronics (X) → 삼성전자 (O)
  • COMPETITOR (X) → COMPETES_WITH (O)

스키마 있이

에디터 로딩 중...

LLM 생성:

에디터 로딩 중...

스키마만 있으면 정확도 +20%


효과적인 스키마 포맷

방법 1: LangChain 기본 (자동)

에디터 로딩 중...

방법 2: 커스텀 포맷 (추천)

에디터 로딩 중...

왜 커스텀 포맷이 나은가?

  1. 예시값 포함 → LLM이 데이터 형식 이해
  2. 한글 사용 명시 → 영어로 바꾸지 않음
  3. 관계 설명 → 언제 어떤 관계를 쓸지 명확

스키마 크기 최적화

대규모 DB는 스키마가 수천 줄. 전부 포함하면 토큰 낭비.

에디터 로딩 중...

실무 팁: 10개 미만 레이블은 전체 포함, 그 이상은 필터링