45

실습: LLM 기반 엔티티 추출

Triple 추출 & Entity Linking

학습 목표

LLM NER: 도메인 특화 엔티티 유연하게 추출 JSON 출력 + 코드블록 처리 필수 프롬프트로 엔티티 유형 명확히 제한

LLM 기반 엔티티 추출

전통적인 NER 모델(spaCy 등)은 사전 정의된 엔티티 유형만 추출합니다. LLM은 도메인 특화 엔티티도 유연하게 추출할 수 있습니다.


왜 배우는가?

전통 NER vs LLM NER

측면전통 NER (spaCy)LLM NER
엔티티 유형고정 (PERSON, ORG 등)유연 (도메인 특화)
정확도학습 데이터에 의존제로샷 가능
속도빠름느림
비용무료API 비용

GraphRAG에서는 LLM NER이 더 적합:

  • 도메인 특화 엔티티 (제품명, 기술명 등)
  • 관계도 함께 추출 가능
  • 프롬프트로 쉽게 커스터마이징

구현 방법

엔티티 추출 프롬프트 설계

에디터 로딩 중...

자주 하는 실수

자주 하는 실수

1. JSON 파싱 실패

에디터 로딩 중...

2. 과도한 추출

에디터 로딩 중...

3. 불일치 이름 처리

에디터 로딩 중...
에디터 로딩 중...