使用Wikipedia API在特定时间范围内获取最多阅读的文章?

时间:2017-06-04 15:18:35

标签: wikipedia wikipedia-api

给定一些整数n和日期d,我想使用维基百科API在{{1}之间的时间内获取n次查看最多的文章和当前日期。这是可能的,如果是的话,怎么样?

到目前为止我所尝试的是以下内容:

  1. 使用https://wikimedia.org/api/rest_v1/metrics/pageviews/top/en.wikipedia/all-access/2017/05/01。这种方法的问题在于,首先,这似乎不支持除d之外的其他值,其次,它仅聚合视图一天而不是任意时间范围。

  2. 使用列表n = 1000的{​​{3}}操作(即query)获取所有文章,但我不知道如何过滤结果,只有查看次数最多文章包括在内。

  3. 我还检查过https://en.wikipedia.org/w/api.php?action=query&format=json&list=allpages,但在那里找不到任何有用的东西。

1 个答案:

答案 0 :(得分:0)

目前,此功能似乎无法通过Pageviews API提供。您可以找到给定日期或给定月份中查看次数最多的文章,但不能查找任意时间范围内的文章。有关可用的不同选项,请参阅REST API docs,另请参阅Pageviews API page on Wikitech,其中提供了查找给定月份中查看次数最多的文章的示例。 (有点令人担忧的是,API文档页面上似乎没有记录每月浏览量最多的文章。)

您也可以通过Action API(api.php)获取网页浏览数据,如Tgr在下面的评论中所述,但数据与REST API相同。

您可能想要询问维基媒体开发者观看的wikitech-l email list。他们将能够以不同的方式告诉您这是否可能,如果没有,为什么该功能不可用。

相关问题