25

프로덕션 KG 모니터링 & 알림

KG 품질 관리 & 거버넌스

학습 목표

프로덕션 KG의 핵심 모니터링 메트릭을 이해한다 대시보드와 알림 규칙을 설계할 수 있다

프로덕션 KG 모니터링 & 알림 시스템

학습 목표

  • 프로덕션 KG의 핵심 모니터링 메트릭을 이해한다
  • 대시보드와 알림 규칙을 설계할 수 있다

핵심 모니터링 메트릭 4가지

에디터 로딩 중...

1. 성장률 (Growth Rate)

에디터 로딩 중...

알림 규칙:

  • 일일 신규 노드가 평소의 200% 이상 → 대량 임포트 확인
  • 일일 신규 노드가 0 → ETL 파이프라인 장애 확인

2. 쿼리 성능 (Query Performance)

메트릭정상경고위험
p50 응답시간<20ms20-50ms>50ms
p95 응답시간<100ms100-500ms>500ms
p99 응답시간<500ms500ms-2s>2s
초당 쿼리 수기준선 ±20%±50%±100%

3. 데이터 신선도 (Data Freshness)

에디터 로딩 중...

4. 검증 실패율 (Validation Failure Rate)

에디터 로딩 중...

알림 규칙 설계

조건심각도액션
검증 실패율 > 5%Critical데이터 파이프라인 중단 + Steward 알림
노후 데이터 > 20%WarningSteward에게 리뷰 요청
p95 응답시간 > 500msWarning인덱스/쿼리 최적화 검토
일일 신규 노드 = 0CriticalETL 파이프라인 점검
핵심 포인트
  • 4대 모니터링 메트릭: 성장률, 쿼리 성능, 데이터 신선도, 검증 실패율
  • 성장률 이상: 대량 임포트 or ETL 장애 신호
  • p95 응답시간 100ms 이하가 프로덕션 목표
  • 검증 실패율 5% 초과 시 데이터 파이프라인 중단 고려