35

실습: Fuzzy Matching 전략

Day 2: 문자열 유사도 & Fuzzy Matching

학습 목표

다양한 Fuzzy Matching 기법을 구현할 수 있다 상황에 맞는 전처리와 유사도 조합을 적용할 수 있다

미션: 실전 Fuzzy Matching 파이프라인 구축

고객 데이터 매칭 시나리오에서 발생하는 다양한 케이스를 처리하는 Fuzzy Matching 파이프라인을 구축하라.

케이스

  1. 이름 변형 (한글/영문, 공백, 오타)
  2. 회사명 변형 (약어, 법인 접미사)
  3. 주소 변형 (생략, 순서, 표기)

단계

  1. 전처리 함수 구현
  2. 필드별 최적 유사도 알고리즘 선택
  3. 복합 점수 계산
  4. 임계값 설정 및 매칭 결정
에디터 로딩 중...
힌트 보기
  • 정규표현식 re.sub()로 패턴 제거
  • jellyfish.jaro_winkler_similarity()로 유사도 계산
  • Token Jaccard는 set 연산 사용
정답 보기
에디터 로딩 중...