🏆40분
SPARQL 분석 챌린지: Wikidata 탐구
SPARQL 쿼리 언어
SPARQL 분석 챌린지: Wikidata 탐구
온톨로지 & 시맨틱웹 > SPARQL 쿼리 언어
학습 목표
Wikidata SPARQL로 실전 데이터 분석을 수행할 수 있다 SPARQL과 Cypher의 차이를 실전 쿼리로 비교할 수 있다
Wikidata로 실전 데이터 분석하기
도전 목표
Wikidata SPARQL 엔드포인트를 사용하여 한국 관련 데이터를 분석합니다. Python SPARQLWrapper로 쿼리를 실행하고, pandas로 결과를 분석합니다.
요구사항
Part 1: 5가지 SPARQL 쿼리 작성 및 실행
에디터 로딩 중...
Part 2: 결과 분석 (pandas)
에디터 로딩 중...
Part 3: SPARQL vs Cypher 비교 작성
쿼리 1과 쿼리 3을 Cypher로도 작성하세요 (실행 불필요, 문법만). 두 쿼리를 비교하며 SPARQL과 Cypher의 차이를 주석으로 설명하세요.
에디터 로딩 중...
산출물
- Python 코드 파일 (5개 쿼리 + 분석)
- CSV 파일 2개 이상 (쿼리 결과)
- SPARQL vs Cypher 비교 주석
보너스
- 쿼리 6: CONSTRUCT로 한국 도시 데이터를 Schema.org 형식 RDF로 변환
- 쿼리 7: ASK로 "서울의 인구가 1000만 이상인가?" 확인
- 결과를 matplotlib/seaborn으로 시각화
평가 기준
| 항목 | 배점 |
|---|---|
| 5개 SPARQL 쿼리 정확성 | 30% |
| Python 코드 동작 여부 | 25% |
| pandas 분석 (통계/정렬/필터) | 20% |
| SPARQL vs Cypher 비교 분석 | 25% |
힌트 보기
Wikidata Q/P ID를 모르면 wikidata.org에서 검색 SERVICE wikibase:label 잊지 마세요 (없으면 Q-ID만 나옴) LIMIT을 작게 시작하고 점진적으로 늘리기 pandas: df['column'].astype(int)로 숫자 변환 쿼리가 느리면 FILTER, LIMIT으로 범위 줄이기 Wikidata 쿼리 에디터(query.wikidata.org)에서 먼저 테스트