35분
실습: Fuzzy Matching 전략
Day 2: 문자열 유사도 & Fuzzy Matching
실습: Fuzzy Matching 전략
Entity Resolution & 데이터 통합 > Day 2: 문자열 유사도 & Fuzzy Matching
학습 목표
다양한 Fuzzy Matching 기법을 구현할 수 있다 상황에 맞는 전처리와 유사도 조합을 적용할 수 있다
미션: 실전 Fuzzy Matching 파이프라인 구축
고객 데이터 매칭 시나리오에서 발생하는 다양한 케이스를 처리하는 Fuzzy Matching 파이프라인을 구축하라.
케이스
- 이름 변형 (한글/영문, 공백, 오타)
- 회사명 변형 (약어, 법인 접미사)
- 주소 변형 (생략, 순서, 표기)
단계
- 전처리 함수 구현
- 필드별 최적 유사도 알고리즘 선택
- 복합 점수 계산
- 임계값 설정 및 매칭 결정
에디터 로딩 중...
힌트 보기
- • 정규표현식 re.sub()로 패턴 제거
- • jellyfish.jaro_winkler_similarity()로 유사도 계산
- • Token Jaccard는 set 연산 사용
정답 보기
에디터 로딩 중...