40

Wikidata SPARQL 실습

SPARQL 쿼리 언어

학습 목표

Python SPARQLWrapper로 SPARQL 엔드포인트에 쿼리할 수 있다 Wikidata의 Q/P ID 체계를 이해하고 활용할 수 있다

Python으로 Wikidata의 세계 지식 쿼리하기

학습 목표

  • Python SPARQLWrapper를 사용하여 SPARQL 엔드포인트에 쿼리할 수 있다
  • Wikidata의 ID 체계(Q-item, P-property)를 이해한다
  • 실전 SPARQL 쿼리 5가지를 작성하고 실행할 수 있다

사전 준비

에디터 로딩 중...

Step 1: SPARQLWrapper 기본 사용법

에디터 로딩 중...

Step 2: Wikidata ID 체계 이해

에디터 로딩 중...

Step 3: 쿼리 1 — 한국의 도시들 (인구순)

에디터 로딩 중...

Step 4: 쿼리 2 — 한국 출신 노벨상 수상자... 는 없으니, 한국 대학교

에디터 로딩 중...

Step 5: 쿼리 3 — 프로그래밍 언어 비교

에디터 로딩 중...

Step 6: 쿼리 4 — 한국 기업 (매출 기준)

에디터 로딩 중...

Step 7: 쿼리 5 — ASK와 CONSTRUCT

에디터 로딩 중...

실습 과제

  1. 위 코드를 순서대로 실행하세요
  2. 쿼리 수정: 일본(Q17)의 도시를 인구순으로 조회하세요
  3. 새 쿼리: 한국인(Q884 국적) 중 과학자(Q901)를 찾아보세요
  4. 새 쿼리: 특정 대학(예: KAIST)의 졸업생 목록을 조회하세요
  5. 결과를 CSV 파일로 저장하세요 (df.to_csv())
에디터 로딩 중...
힌트 보기
  • query.wikidata.org에서 먼저 테스트하고 Python으로 옮기면 편함
  • Wikidata Q-ID 찾기: www.wikidata.org에서 검색
  • User-Agent 헤더 필수 (Wikidata 정책)
  • OPTIONAL로 없을 수 있는 속성 처리
  • LIMIT을 작게 시작하고 점진적으로 늘리기 (API 부하 방지)
정답 보기
에디터 로딩 중...