我在维基百科API中查找给定类别的页面列表。但是页面由page_id表示。如何使用Wikipedia API通过其page_id获取页面实际文本内容
答案 0 :(得分:0)
AFAIK没有直接从pageid获取维基页面文本的方法 但是有一些解决方法
获取网址然后解析
通过进行API调用来获取wikipage的URL
http://en.wikipedia.org/w/api.php?action=query&prop=info&pageids=<your_pageid_here>&inprop=url
然后转到URL并解析文本
获取网页名称,然后获取内容
Wikipedia API允许在知道页面名称的情况下提取文本。但是你现在只知道pageid,你需要使用像
这样的API调用将pageid转换为pagename。 http://en.wikipedia.org/w/api.php?action=query&pageids=<your_pageid_here>&format=json
这将为您提供页面名称,然后您可以进行另一次API调用以获取内容
http://en.wikipedia.org/w/api.php?action=parse&prop=text&page=<your_pagename_here>&format=json