30분
테이블→그래프 변환: 두 가지 접근법
Multimodal VLM: 표와 이미지를 그래프로
테이블→그래프 변환: 두 가지 접근법
GraphRAG > Multimodal VLM: 표와 이미지를 그래프로
학습 목표
접근법 A: 관계형 테이블 → Entity/Relationship 직접 추출 접근법 B: 수치 테이블 → 요약 + 벡터화 문서 계층 구조로 컨텍스트 보존
테이블→그래프 변환: 두 가지 접근법
Hook: 보험 상품 비교표를 그래프로?
에디터 로딩 중...
이 테이블을 Knowledge Graph로 어떻게 변환할까요? 테이블 유형에 따라 두 가지 접근법이 필요합니다.
왜 배우는가?
왜 두 가지 접근법이 필요한가?
모든 테이블이 같지 않습니다:
| 테이블 유형 | 예시 | 특징 |
|---|---|---|
| 관계형 | 조직도, 투자 내역, 거래 기록 | 엔티티 간 관계 명확 |
| 수치형 | 재무제표, 통계, 성능 지표 | 숫자 중심, 관계 모호 |
핵심 개념
접근법 A: 관계 중심 (Entity-Relationship)
에디터 로딩 중...
적합한 테이블: 조직도, 거래 기록, 투자 관계
예시 변환:
에디터 로딩 중...
접근법 B: 정보 중심 (Summary + Vector)
에디터 로딩 중...
적합한 테이블: 재무제표, 통계 데이터, 성능 지표
Pinterest 모델: 테이블 → DB → SQL 쿼리 → 요약 → 벡터 임베딩
예시:
에디터 로딩 중...
문서 계층 구조 (컨텍스트 보존)
에디터 로딩 중...
"1장 3절에서 언급됨" 같은 컨텍스트를 보존하여 검색 정밀도 향상
두 접근법 비교
| 차원 | 접근법 A (관계 중심) | 접근법 B (정보 중심) |
|---|---|---|
| 엔티티/관계 명확성 | ✅ 명확 | ⚠️ 모호 |
| 그래프 추론 정확도 | ✅ 높음 | ⚠️ 낮음 |
| Cypher 검색 | ✅ 완전 지원 | ⚠️ 제한적 |
| 정보 보존 | ⚠️ 일부 손실 | ✅ 최소 손실 |
| 벡터 검색 | ❌ 불가 | ✅ 가능 |
| 설계 복잡도 | ⚠️ 높음 (온톨로지 필요) | ✅ 낮음 |
가이드: 관계가 명확한 테이블 → A, 수치 중심 테이블 → B, 둘 다 → 하이브리드
핵심 포인트
- • 접근법 A: 관계형 테이블 → Entity/Relationship 직접 추출
- • 접근법 B: 수치 테이블 → 요약 + 벡터화
- • 문서 계층 구조로 컨텍스트 보존
- • 테이블 유형에 따라 접근법 선택