35

실습: recordlinkage로 고객 데이터 매칭

Day 1: Entity Resolution 개론

학습 목표

recordlinkage 파이프라인을 직접 구현할 수 있다 Blocking과 Comparison 전략을 적용할 수 있다

미션: 두 고객 데이터베이스 통합

M&A 후 두 회사의 고객 DB를 통합해야 한다. recordlinkage를 사용해 동일 고객을 찾아라.

데이터

  • System A: 본사 CRM (500건)
  • System B: 인수회사 CRM (300건)

단계

  1. 샘플 데이터 생성
  2. Blocking (같은 지역끼리)
  3. 유사도 비교
  4. 매칭 결과 확인
에디터 로딩 중...
힌트 보기
  • indexer.block("city")로 같은 도시끼리 비교
  • compare.string(..., method="jarowinkler")로 이름 비교
  • features[조건].index로 매칭된 인덱스 추출
정답 보기
에디터 로딩 중...