🏆45분
Challenge: Active Learning 전략 비교
Day 4: ML 기반 Entity Resolution
Challenge: Active Learning 전략 비교
Entity Resolution & 데이터 통합 > Day 4: ML 기반 Entity Resolution
학습 목표
다양한 Active Learning 전략을 구현하고 비교할 수 있다 최적의 레이블링 전략을 선택할 수 있다
요구사항
Uncertainty Sampling 구현
Random Sampling과 비교
학습 곡선(Learning Curve) 시각화
최적 전략 분석
평가 기준
- • Active Learning이 올바르게 구현되었는가?
- • 비교 실험이 공정한가?
- • 시각화가 명확한가?
- • 분석이 통찰력 있는가?
보너스
- • Query by Committee 전략 추가 구현
- • 여러 랜덤 시드로 실험 반복 (통계적 유의성)
- • 최적 n_query 값 탐색
힌트 보기
model.predict_proba(X)[:, 1]로 확률 계산 np.argsort(uncertainty)[:n_query]로 상위 선택 unlabeled_mask = ~labeled_mask로 레이블 안 된 것 필터