▶️25분
Triple 추출: 텍스트를 Knowledge Graph로
Triple 추출 & Entity Linking
Triple 추출: 텍스트를 Knowledge Graph로
GraphRAG > Triple 추출 & Entity Linking
학습 목표
Triple = (Subject, Predicate, Object) LLM으로 비정형 텍스트에서 자동 추출 멀티홉 추론을 위해 구조화 필수
▶️
영상 준비 중
25분
Triple 추출: 텍스트를 Knowledge Graph로
Hook: 비정형 텍스트의 한계
"삼성전자 이재용 회장이 NVIDIA의 젠슨 황 CEO와 AI 반도체 협력을 논의했다."
이 문장을 그대로 벡터 DB에 저장하면:
- "이재용과 젠슨 황의 관계는?" → 검색 가능
- "삼성전자와 NVIDIA의 관계는?" → 검색 가능
- "이재용이 만난 CEO 중 AI 회사 대표는?" → 검색 어려움 (멀티홉)
Triple 추출로 이 텍스트를 구조화하면:
에디터 로딩 중...
이제 멀티홉 질문도 Cypher로 답변 가능:
에디터 로딩 중...
왜 배우는가?
Triple이란?
Triple = (Subject, Predicate, Object)
- Subject: 주어 (엔티티)
- Predicate: 관계 (동사)
- Object: 목적어 (엔티티 또는 리터럴)
예시:
| Subject | Predicate | Object |
|---|---|---|
| 이재용 | CEO_OF | 삼성전자 |
| 삼성전자 | COMPETES_WITH | SK하이닉스 |
| NVIDIA | FOUNDED_IN | 1993 |
왜 Triple 추출인가?
- 비정형 → 구조화: 텍스트를 그래프로 변환
- 자동화: LLM이 대량 문서에서 자동 추출
- 통합: 여러 소스의 정보를 하나의 KG로 연결
핵심 개념
Triple 추출 파이프라인
에디터 로딩 중...
핵심 단계
- Named Entity Recognition (NER): 엔티티 식별
- Relation Extraction (RE): 관계 추출
- Entity Linking: 동일 엔티티 연결 (별칭 처리)
- Graph Construction: Neo4j에 저장
핵심 포인트
- • Triple = (Subject, Predicate, Object)
- • LLM으로 비정형 텍스트에서 자동 추출
- • 멀티홉 추론을 위해 구조화 필수
- • 정규화와 Entity Linking이 품질 결정