25분
프로덕션 KG 모니터링 & 알림
KG 품질 관리 & 거버넌스
프로덕션 KG 모니터링 & 알림
KG 생명주기 & 엔터프라이즈 활용 > KG 품질 관리 & 거버넌스
학습 목표
프로덕션 KG의 핵심 모니터링 메트릭을 이해한다 대시보드와 알림 규칙을 설계할 수 있다
프로덕션 KG 모니터링 & 알림 시스템
학습 목표
- 프로덕션 KG의 핵심 모니터링 메트릭을 이해한다
- 대시보드와 알림 규칙을 설계할 수 있다
핵심 모니터링 메트릭 4가지
에디터 로딩 중...
1. 성장률 (Growth Rate)
에디터 로딩 중...
알림 규칙:
- 일일 신규 노드가 평소의 200% 이상 → 대량 임포트 확인
- 일일 신규 노드가 0 → ETL 파이프라인 장애 확인
2. 쿼리 성능 (Query Performance)
| 메트릭 | 정상 | 경고 | 위험 |
|---|---|---|---|
| p50 응답시간 | <20ms | 20-50ms | >50ms |
| p95 응답시간 | <100ms | 100-500ms | >500ms |
| p99 응답시간 | <500ms | 500ms-2s | >2s |
| 초당 쿼리 수 | 기준선 ±20% | ±50% | ±100% |
3. 데이터 신선도 (Data Freshness)
에디터 로딩 중...
4. 검증 실패율 (Validation Failure Rate)
에디터 로딩 중...
알림 규칙 설계
| 조건 | 심각도 | 액션 |
|---|---|---|
| 검증 실패율 > 5% | Critical | 데이터 파이프라인 중단 + Steward 알림 |
| 노후 데이터 > 20% | Warning | Steward에게 리뷰 요청 |
| p95 응답시간 > 500ms | Warning | 인덱스/쿼리 최적화 검토 |
| 일일 신규 노드 = 0 | Critical | ETL 파이프라인 점검 |
핵심 포인트
- • 4대 모니터링 메트릭: 성장률, 쿼리 성능, 데이터 신선도, 검증 실패율
- • 성장률 이상: 대량 임포트 or ETL 장애 신호
- • p95 응답시간 100ms 이하가 프로덕션 목표
- • 검증 실패율 5% 초과 시 데이터 파이프라인 중단 고려