如何从Wikidata Id获取维基百科pageid?

时间:2017-05-02 20:36:59

标签: wikipedia wikidata

我想从维基数据ID获取维基百科的pageid,如何从wikidata查询服务或其他方法获取它与python?因为我没有在wikidata中看到任何名为wikipedia id的属性。

3 个答案:

答案 0 :(得分:2)

首先,您需要从维基数据ID获取维基百科页面title,这可以通过对维基数据API wbgetentities模块的请求来完成,如下所示:https://www.wikidata.org/w/api.php?action=wbgetentities&ids=Q123&format=json&props=sitelinks

然后,一旦您从所需的维基百科版本中找到维基百科标题,您就可以从该Wikipedia API获取相关的页面ID:https://en.wikipedia.org/w/api.php?action=query&titles=September&format=json

所以从这些示例网址中你可以得到:
Wikidata id = Q123
=>英语维基百科(enwiki)title = September
=> pageid = 15580374

答案 1 :(得分:1)

我不确定,如果DBpedia始终同时包含wikiPageID和维基数据ID,但您可以在DBpedia上尝试以下查询:

PREFIX wd: <http://www.wikidata.org/entity/> 
SELECT ?wikipedia_id WHERE {
    ?dbpedia_id owl:sameAs ?wikidata_id  .
    ?dbpedia_id dbo:wikiPageID ?wikipedia_id .
    VALUES (?wikidata_id) {(wd:Q123)} 
}

Try it!

或者您可以在维基数据上尝试以下联合查询:

PREFIX wd: <http://www.wikidata.org/entity/> 
PREFIX owl: <http://www.w3.org/2002/07/owl#> 
PREFIX dbo: <http://dbpedia.org/ontology/>  

SELECT ?wikipedia_id where {
    VALUES (?wikidata_id)  {(wd:Q123)}
    SERVICE <http://dbpedia.org/sparql> {
       ?dbpedia_id owl:sameAs ?wikidata_id .
       ?dbpedia_id dbo:wikiPageID ?wikipedia_id 
    } 
}

Try it!

<强>更新

您可以使用维基数据上的MWAPI来呼叫维基百科API:

SELECT ?pageid WHERE {
    VALUES (?item) {(wd:Q123)} 
    [ schema:about ?item ; schema:name ?name ;
      schema:isPartOf <https://en.wikipedia.org/> ]
     SERVICE wikibase:mwapi {
         bd:serviceParam wikibase:endpoint "en.wikipedia.org" .
         bd:serviceParam wikibase:api "Generator" .
         bd:serviceParam mwapi:generator "allpages" .
         bd:serviceParam mwapi:gapfrom ?name .
         bd:serviceParam mwapi:gapto ?name .
         ?pageid wikibase:apiOutput "@pageid" .
    }
}

Try it!

不幸的是,你似乎是have to use一个发电机; allpages似乎是最合适的。

答案 2 :(得分:1)

在CURL通话中使用以下网址。您必须在下面的链接中更改WikiDataID Q243。

例如,如果您希望wikiPageID为 Taj_Mahal ,则将Q243替换为Q9141 ,并执行CURL调用。

  

http://dbpedia.org/sparql?default-graph-uri=http%3A%2F%2Fdbpedia.org&query=PREFIX+wd%3A+%3Chttp%3A%2F%2Fwww.wikidata.org%2Fentity%2F%3E+%0D%0ASELECT+%3FwikiPageID+WHERE+%7B%0D%0A%3Fdbpedia_id+owl%3AsameAs+%3Fwikidata_id++.%0D%0A%3Fdbpedia_id+dbo%3AwikiPageID+%3FwikiPageID+.%0D%0AVALUES+%28%3Fwikidata_id%29+%7B%28wd%3AQ243%29%7D+%0D%0A%7D&format=application%2Fsparql-results%2Bjson&CXML_redir_for_subjs=121&CXML_redir_for_hrefs=&timeout=30000&debug=on&run=+Run+Query

要通过wikiDataId获取WikiPageID,您必须修改上述链接或在上面的链接中替换您选择的wikiDataID。

注意:

1)在CURL Call

中使用标签this URL获取WikiPageID

2)找到Q243并替换为你的wikiDataID