从第三方Wiki页面获取信息

时间:2014-04-25 00:45:37

标签: java mediawiki-api

在我正在开展的项目中,我需要访问来自网站explainxkcd.com的信息,该网站提供了特定xkcd漫画的解释。我正在寻找的信息将是漫画作为字符串的解释。 Explainxkcd是一个使用mediawiki运行的网站,这个软件构成了" wiki"感觉。 Mediawiki有一个api,允许你从他们的网站中提取信息,我已经去http://www.mediawiki.org/wiki/API:Main_page试图弄清楚如何在这个特定的wiki网站上使用他们的API,但无济于事。看来你可以替换" index.php"在带有api.php的网址中使用API​​,但是当我为http://explainxkcd.com/9/api.php试用它时,它似乎无法正常工作。我猜我的网址有误,但我没有看到有关如何找到用于Explainxkcd.com的特定网址的任何信息

问题:

如何从Java程序中的第三方维基百科页面访问信息?这可以通过mediawiki api或其他一些解决方案。如果您知道一种很好的方法来查找可以与mediawiki一起使用的URL,那将是首选。只是想在这里寻找正确的方向。

由于

1 个答案:

答案 0 :(得分:1)

使用相同的方法,s / index.php / api.php /,我得到一个不同的结果:http://www.explainxkcd.com/wiki/api.php似乎有用。如果维基使用漂亮的网址(例如example.com/wiki/Main_Page),只需点击修改,查看来源或历史记录。

是的,请使用API​​而不是屏幕抓取。您可以看到一些现有的Java库here