🏆40

SPARQL 분석 챌린지: Wikidata 탐구

SPARQL 쿼리 언어

학습 목표

Wikidata SPARQL로 실전 데이터 분석을 수행할 수 있다 SPARQL과 Cypher의 차이를 실전 쿼리로 비교할 수 있다

Wikidata로 실전 데이터 분석하기

도전 목표

Wikidata SPARQL 엔드포인트를 사용하여 한국 관련 데이터를 분석합니다. Python SPARQLWrapper로 쿼리를 실행하고, pandas로 결과를 분석합니다.


요구사항

Part 1: 5가지 SPARQL 쿼리 작성 및 실행

에디터 로딩 중...

Part 2: 결과 분석 (pandas)

에디터 로딩 중...

Part 3: SPARQL vs Cypher 비교 작성

쿼리 1과 쿼리 3을 Cypher로도 작성하세요 (실행 불필요, 문법만). 두 쿼리를 비교하며 SPARQL과 Cypher의 차이를 주석으로 설명하세요.

에디터 로딩 중...

산출물

  1. Python 코드 파일 (5개 쿼리 + 분석)
  2. CSV 파일 2개 이상 (쿼리 결과)
  3. SPARQL vs Cypher 비교 주석

보너스

  • 쿼리 6: CONSTRUCT로 한국 도시 데이터를 Schema.org 형식 RDF로 변환
  • 쿼리 7: ASK로 "서울의 인구가 1000만 이상인가?" 확인
  • 결과를 matplotlib/seaborn으로 시각화

평가 기준

항목배점
5개 SPARQL 쿼리 정확성30%
Python 코드 동작 여부25%
pandas 분석 (통계/정렬/필터)20%
SPARQL vs Cypher 비교 분석25%
힌트 보기
Wikidata Q/P ID를 모르면 wikidata.org에서 검색
SERVICE wikibase:label 잊지 마세요 (없으면 Q-ID만 나옴)
LIMIT을 작게 시작하고 점진적으로 늘리기
pandas: df['column'].astype(int)로 숫자 변환
쿼리가 느리면 FILTER, LIMIT으로 범위 줄이기
Wikidata 쿼리 에디터(query.wikidata.org)에서 먼저 테스트