▶️15분
Hook: 데이터 수집의 현실
데이터 수집 & 전처리
Hook: 데이터 수집의 현실
Phase 3 캡스톤: Knowledge Graph 프로젝트 > 데이터 수집 & 전처리
학습 목표
데이터 수집의 중요성 이해
▶️
영상 준비 중
15분
Hook: "아무리 좋은 온톨로지도 데이터 없이는 빈 껍데기"
실제 사례: 데이터 품질의 중요성
에디터 로딩 중...
Day 2 목표
에디터 로딩 중...
데이터 소스 유형
| 유형 | 예시 | 특징 |
|---|---|---|
| API | 네이버 뉴스, GitHub | 구조화, Rate Limit |
| 웹 스크래핑 | 뉴스 사이트 | 비구조화, robots.txt |
| 파일 | PDF, CSV, JSON | 로컬 처리 |
| 데이터베이스 | PostgreSQL, MongoDB | 대용량 |
핵심 포인트
- • 데이터 품질이 KG 품질 결정
- • 수집 전 정제 전략 필수
- • 다양한 데이터 소스 통합 필요