45분
실습: LLM 기반 엔티티 추출
Triple 추출 & Entity Linking
실습: LLM 기반 엔티티 추출
GraphRAG > Triple 추출 & Entity Linking
학습 목표
LLM NER: 도메인 특화 엔티티 유연하게 추출 JSON 출력 + 코드블록 처리 필수 프롬프트로 엔티티 유형 명확히 제한
LLM 기반 엔티티 추출
전통적인 NER 모델(spaCy 등)은 사전 정의된 엔티티 유형만 추출합니다. LLM은 도메인 특화 엔티티도 유연하게 추출할 수 있습니다.
왜 배우는가?
전통 NER vs LLM NER
| 측면 | 전통 NER (spaCy) | LLM NER |
|---|---|---|
| 엔티티 유형 | 고정 (PERSON, ORG 등) | 유연 (도메인 특화) |
| 정확도 | 학습 데이터에 의존 | 제로샷 가능 |
| 속도 | 빠름 | 느림 |
| 비용 | 무료 | API 비용 |
GraphRAG에서는 LLM NER이 더 적합:
- 도메인 특화 엔티티 (제품명, 기술명 등)
- 관계도 함께 추출 가능
- 프롬프트로 쉽게 커스터마이징
구현 방법
엔티티 추출 프롬프트 설계
에디터 로딩 중...
자주 하는 실수
자주 하는 실수
1. JSON 파싱 실패
에디터 로딩 중...
2. 과도한 추출
에디터 로딩 중...
3. 불일치 이름 처리
에디터 로딩 중...
에디터 로딩 중...