30분
실습: 복합 점수 설계 & 임계값 튜닝
Day 2: 문자열 유사도 & Fuzzy Matching
실습: 복합 점수 설계 & 임계값 튜닝
Entity Resolution & 데이터 통합 > Day 2: 문자열 유사도 & Fuzzy Matching
학습 목표
필드별 가중치를 설계할 수 있다 임계값 튜닝을 통해 정확도를 최적화할 수 있다
미션: 복합 점수 시스템 설계
단일 필드 유사도만으로는 부족하다. 여러 필드의 유사도를 조합하여 최종 매칭 점수를 계산하라.
요구사항
- 필드별 가중치 설계
- 임계값 테스트
- Precision/Recall 트레이드오프 분석
에디터 로딩 중...
힌트 보기
- • 가중치 합은 1.0이 되도록
- • F1 = 2 * precision * recall / (precision + recall)
- • 전화번호가 강력한 식별자임을 고려
정답 보기
에디터 로딩 중...