20

Common Pitfalls: 자주 하는 실수

Day 2: 커뮤니티 탐지

학습 목표

알고리즘 선택 오류 방지 Resolution 파라미터 올바르게 사용 LPA 비결정성 대응 결과 검증 방법

커뮤니티 탐지 Common Pitfalls

Pitfall 1: 모든 상황에 Louvain만 사용

증상

  • 대규모 실시간 처리에서 성능 저하
  • 10억 노드 그래프에서 몇 시간 소요

원인

Louvain은 품질이 좋지만 대규모에서 느릴 수 있음

해결책

에디터 로딩 중...
에디터 로딩 중...

Pitfall 2: Resolution 의미 오해

증상

  • 원하는 크기의 커뮤니티를 못 찾음
  • "resolution 높이면 더 정밀"이라고 오해

올바른 이해

에디터 로딩 중...

예시

에디터 로딩 중...

Pitfall 3: LPA 결과가 매번 다름

증상

에디터 로딩 중...

원인

LPA는 비결정적 알고리즘:

  • 노드 방문 순서가 무작위
  • 동점일 때 무작위 선택

해결책

에디터 로딩 중...

Pitfall 4: 연결 안 된 노드 무시

증상

  • 일부 노드가 커뮤니티 결과에 없음
  • 고립된 노드 처리 누락

원인

고립된 노드는 자기 자신만의 커뮤니티

해결책

에디터 로딩 중...

Pitfall 5: Modularity만 보고 판단

증상

  • Modularity가 높은데 비즈니스적으로 무의미한 분할
  • 알고리즘 결과를 그대로 신뢰

원인

Modularity는 수학적 최적이지, 비즈니스 최적이 아님

해결책

에디터 로딩 중...

체크리스트

항목확인
그래프 크기에 맞는 알고리즘 선택?[ ]
resolution 파라미터 의미 이해?[ ]
LPA 비결정성 인지?[ ]
고립 노드 처리?[ ]
결과를 도메인 지식으로 검증?[ ]