从维基百科获取文章类别关系列表的最简单方法是什么?

时间:2017-11-10 12:42:19

标签: wikipedia

我专门针对维基百科(enwiki)的英文版本发言。我通过下载sql转储(categorylinks,page,page_prop)尝试使用其他较轻版本的维基百科,但是使用英文版本并不容易。我现在正在将sql文件中的数据写入数据库,但我想要一些其他更简单的方法,因为这将花费很多时间。如果我真的成功写入数据,查询可能会永远。那么,我如何从英语维基百科中编制文章及其类别列表呢?

1 个答案:

答案 0 :(得分:0)

嗯,这个问题没有简单的答案。使用传统计算机下载和使用转储并不是很平易近人。值得庆幸的是,我使用了一个名为Quarry的服务,让您查询维基百科数据库。但是有一些限制,所以为了获得上面的列表,我不得不使用limit clause将查询切成更小的部分并给出相同的查询+50次。对于想要此数据的任何人,可以访问我的quarry profile并从Article - Categories查询中获取数据。