如何使用Wikipedia api中的page_id获取页面实际内容?

时间:2015-07-16 19:25:29

标签: wikipedia wikipedia-api

我在维基百科API中查找给定类别的页面列表。但是页面由page_id表示。如何使用Wikipedia API通过其page_id获取页面实际文本内容

1 个答案:

答案 0 :(得分:0)

AFAIK没有直接从pageid获取维基页面文本的方法 但是有一些解决方法

获取网址然后解析 通过进行API调用来获取wikipage的URL http://en.wikipedia.org/w/api.php?action=query&prop=info&pageids=<your_pageid_here>&inprop=url

然后转到URL并解析文本

获取网页名称,然后获取内容

Wikipedia API允许在知道页面名称的情况下提取文本。但是你现在只知道pageid,你需要使用像

这样的API调用将pageid转换为pagename。

http://en.wikipedia.org/w/api.php?action=query&pageids=<your_pageid_here>&format=json

这将为您提供页面名称,然后您可以进行另一次API调用以获取内容

http://en.wikipedia.org/w/api.php?action=parse&prop=text&page=<your_pagename_here>&format=json

相关问题