🏆45

Challenge: Active Learning 전략 비교

Day 4: ML 기반 Entity Resolution

학습 목표

다양한 Active Learning 전략을 구현하고 비교할 수 있다 최적의 레이블링 전략을 선택할 수 있다

요구사항

Uncertainty Sampling 구현

Random Sampling과 비교

학습 곡선(Learning Curve) 시각화

최적 전략 분석

평가 기준
  • Active Learning이 올바르게 구현되었는가?
  • 비교 실험이 공정한가?
  • 시각화가 명확한가?
  • 분석이 통찰력 있는가?
보너스
  • Query by Committee 전략 추가 구현
  • 여러 랜덤 시드로 실험 반복 (통계적 유의성)
  • 최적 n_query 값 탐색
힌트 보기
model.predict_proba(X)[:, 1]로 확률 계산
np.argsort(uncertainty)[:n_query]로 상위 선택
unlabeled_mask = ~labeled_mask로 레이블 안 된 것 필터