20분
Common Pitfalls: 자주 하는 실수
Day 2: 커뮤니티 탐지
Common Pitfalls: 자주 하는 실수
그래프 알고리즘 > Day 2: 커뮤니티 탐지
학습 목표
알고리즘 선택 오류 방지 Resolution 파라미터 올바르게 사용 LPA 비결정성 대응 결과 검증 방법
커뮤니티 탐지 Common Pitfalls
Pitfall 1: 모든 상황에 Louvain만 사용
증상
- 대규모 실시간 처리에서 성능 저하
- 10억 노드 그래프에서 몇 시간 소요
원인
Louvain은 품질이 좋지만 대규모에서 느릴 수 있음
해결책
에디터 로딩 중...
에디터 로딩 중...
Pitfall 2: Resolution 의미 오해
증상
- 원하는 크기의 커뮤니티를 못 찾음
- "resolution 높이면 더 정밀"이라고 오해
올바른 이해
에디터 로딩 중...
예시
에디터 로딩 중...
Pitfall 3: LPA 결과가 매번 다름
증상
에디터 로딩 중...
원인
LPA는 비결정적 알고리즘:
- 노드 방문 순서가 무작위
- 동점일 때 무작위 선택
해결책
에디터 로딩 중...
Pitfall 4: 연결 안 된 노드 무시
증상
- 일부 노드가 커뮤니티 결과에 없음
- 고립된 노드 처리 누락
원인
고립된 노드는 자기 자신만의 커뮤니티
해결책
에디터 로딩 중...
Pitfall 5: Modularity만 보고 판단
증상
- Modularity가 높은데 비즈니스적으로 무의미한 분할
- 알고리즘 결과를 그대로 신뢰
원인
Modularity는 수학적 최적이지, 비즈니스 최적이 아님
해결책
에디터 로딩 중...
체크리스트
| 항목 | 확인 |
|---|---|
| 그래프 크기에 맞는 알고리즘 선택? | [ ] |
| resolution 파라미터 의미 이해? | [ ] |
| LPA 비결정성 인지? | [ ] |
| 고립 노드 처리? | [ ] |
| 결과를 도메인 지식으로 검증? | [ ] |