35

KG 품질 6가지 차원

KG 품질 관리 & 거버넌스

학습 목표

KG 품질의 6가지 측정 차원을 이해한다 각 차원별 메트릭과 개선 방법을 파악한다

KG 품질 6가지 차원 (Quality Dimensions)

학습 목표

  • KG 품질의 6가지 측정 차원을 이해한다
  • 각 차원별 메트릭과 개선 방법을 파악한다

품질 6차원 프레임워크

에디터 로딩 중...

1. 정확성 (Accuracy)

정의: KG의 데이터가 현실 세계의 사실과 일치하는 정도

측정 메트릭:

  • 속성 정확도 = 정확한 속성 값 / 전체 속성 값
  • 관계 정확도 = 올바른 관계 / 전체 관계
  • 엔티티 정확도 = 올바른 엔티티 / 전체 엔티티

측정 방법:

에디터 로딩 중...

2. 완전성 (Completeness)

정의: 필요한 정보가 빠짐없이 존재하는 정도

3가지 수준:

수준설명예시
스키마 완전성필요한 엔티티/관계 타입이 모두 정의됨Person에 email 속성 누락
속성 완전성각 노드의 필수 속성이 채워짐30%의 Person에 age 누락
관계 완전성존재해야 할 관계가 모두 존재Employee에 WORKS_IN 관계 없음

측정 Cypher:

에디터 로딩 중...

3. 일관성 (Consistency)

정의: 데이터 간에 모순이 없는 정도

일관성 위반 예시:

에디터 로딩 중...

4. 적시성 (Timeliness)

정의: 데이터가 현재 상태를 반영하는 정도

측정:

에디터 로딩 중...

5. 가용성 (Availability)

정의: 필요할 때 데이터에 접근할 수 있는 정도

  • 쿼리 응답 시간 (p95 < 100ms)
  • 시스템 가동률 (99.9%+)
  • API 장애율

6. 신뢰성 (Trustworthiness)

정의: 데이터 출처가 신뢰할 만한 정도

출처별 신뢰도 등급:

등급출처신뢰도
A공식 데이터베이스 (정부, 기업 공시)95%+
B전문 큐레이션 (Wikipedia, Wikidata)85~95%
C자동 추출 (NLP, 크롤링)70~85%
D사용자 입력 (검증 안 됨)50~70%

품질 점수 종합 계산

에디터 로딩 중...

📖 심화 읽기: 이강배 외, "지식그래프: AI와 온톨로지로 여는 지식혁명", 유원북스, 2025 — 7장 KG 품질 관리

핵심 포인트
  • KG 품질 6차원: 정확성, 완전성, 일관성, 적시성, 가용성, 신뢰성
  • 완전성은 스키마/속성/관계 3가지 수준에서 측정
  • 일관성: 같은 엔티티의 속성 간 모순 탐지
  • 적시성: updatedAt 기반 데이터 노후화 추적
  • 품질 점수 = 6개 차원의 가중 합산 (목표 80점+)