35분
KG 품질 6가지 차원
KG 품질 관리 & 거버넌스
KG 품질 6가지 차원
KG 생명주기 & 엔터프라이즈 활용 > KG 품질 관리 & 거버넌스
학습 목표
KG 품질의 6가지 측정 차원을 이해한다 각 차원별 메트릭과 개선 방법을 파악한다
KG 품질 6가지 차원 (Quality Dimensions)
학습 목표
- KG 품질의 6가지 측정 차원을 이해한다
- 각 차원별 메트릭과 개선 방법을 파악한다
품질 6차원 프레임워크
에디터 로딩 중...
1. 정확성 (Accuracy)
정의: KG의 데이터가 현실 세계의 사실과 일치하는 정도
측정 메트릭:
- 속성 정확도 = 정확한 속성 값 / 전체 속성 값
- 관계 정확도 = 올바른 관계 / 전체 관계
- 엔티티 정확도 = 올바른 엔티티 / 전체 엔티티
측정 방법:
에디터 로딩 중...
2. 완전성 (Completeness)
정의: 필요한 정보가 빠짐없이 존재하는 정도
3가지 수준:
| 수준 | 설명 | 예시 |
|---|---|---|
| 스키마 완전성 | 필요한 엔티티/관계 타입이 모두 정의됨 | Person에 email 속성 누락 |
| 속성 완전성 | 각 노드의 필수 속성이 채워짐 | 30%의 Person에 age 누락 |
| 관계 완전성 | 존재해야 할 관계가 모두 존재 | Employee에 WORKS_IN 관계 없음 |
측정 Cypher:
에디터 로딩 중...
3. 일관성 (Consistency)
정의: 데이터 간에 모순이 없는 정도
일관성 위반 예시:
에디터 로딩 중...
4. 적시성 (Timeliness)
정의: 데이터가 현재 상태를 반영하는 정도
측정:
에디터 로딩 중...
5. 가용성 (Availability)
정의: 필요할 때 데이터에 접근할 수 있는 정도
- 쿼리 응답 시간 (p95 < 100ms)
- 시스템 가동률 (99.9%+)
- API 장애율
6. 신뢰성 (Trustworthiness)
정의: 데이터 출처가 신뢰할 만한 정도
출처별 신뢰도 등급:
| 등급 | 출처 | 신뢰도 |
|---|---|---|
| A | 공식 데이터베이스 (정부, 기업 공시) | 95%+ |
| B | 전문 큐레이션 (Wikipedia, Wikidata) | 85~95% |
| C | 자동 추출 (NLP, 크롤링) | 70~85% |
| D | 사용자 입력 (검증 안 됨) | 50~70% |
품질 점수 종합 계산
에디터 로딩 중...
📖 심화 읽기: 이강배 외, "지식그래프: AI와 온톨로지로 여는 지식혁명", 유원북스, 2025 — 7장 KG 품질 관리
핵심 포인트
- • KG 품질 6차원: 정확성, 완전성, 일관성, 적시성, 가용성, 신뢰성
- • 완전성은 스키마/속성/관계 3가지 수준에서 측정
- • 일관성: 같은 엔티티의 속성 간 모순 탐지
- • 적시성: updatedAt 기반 데이터 노후화 추적
- • 품질 점수 = 6개 차원의 가중 합산 (목표 80점+)