35분
실습: recordlinkage Indexing 전략
Day 3: Blocking & Indexing 전략
실습: recordlinkage Indexing 전략
Entity Resolution & 데이터 통합 > Day 3: Blocking & Indexing 전략
학습 목표
recordlinkage의 다양한 Indexing 메서드를 사용할 수 있다 Blocking 전략별 성능 차이를 비교할 수 있다
미션: Blocking 전략 비교
recordlinkage의 다양한 Indexing 전략을 테스트하고 각 전략의 특성을 비교 분석하라.
단계
- Full Index (기준선)
- Block Index
- Sorted Neighbourhood Index
- 다중 Blocking
- 성능 비교
에디터 로딩 중...
힌트 보기
- • recordlinkage.Index()로 인덱서 생성
- • indexer.block(column) 또는 indexer.block([col1, col2])
- • pairs1.union(pairs2)로 합집합
정답 보기
에디터 로딩 중...