35분
실습: recordlinkage로 고객 데이터 매칭
Day 1: Entity Resolution 개론
실습: recordlinkage로 고객 데이터 매칭
Entity Resolution & 데이터 통합 > Day 1: Entity Resolution 개론
학습 목표
recordlinkage 파이프라인을 직접 구현할 수 있다 Blocking과 Comparison 전략을 적용할 수 있다
미션: 두 고객 데이터베이스 통합
M&A 후 두 회사의 고객 DB를 통합해야 한다. recordlinkage를 사용해 동일 고객을 찾아라.
데이터
- System A: 본사 CRM (500건)
- System B: 인수회사 CRM (300건)
단계
- 샘플 데이터 생성
- Blocking (같은 지역끼리)
- 유사도 비교
- 매칭 결과 확인
에디터 로딩 중...
힌트 보기
- • indexer.block("city")로 같은 도시끼리 비교
- • compare.string(..., method="jarowinkler")로 이름 비교
- • features[조건].index로 매칭된 인덱스 추출
정답 보기
에디터 로딩 중...