我正在尝试检索由特定维基百科文章分开的机器人,注册用户和匿名用户所做的编辑次数。
我知道我可以通过MediaWiki API中的修订版获得文章的所有修订,我想使用rvprop = user来返回进行修订的用户的名称并对检索到的数据进行一些处理。
对于匿名用户修改anon =“”总是发生,所以我可以计算它,但对于机器人我找不到办法,据我所知,机器人名称并不总是以标准化方式编写。 知道怎么做吗?或者更简单的方法是使用其他API来完成这项任务?
答案 0 :(得分:5)
revisions API允许您为每个修订列出flags
- 它们包括编辑是标记为次要还是机器人编辑。例如,请参阅these revisions。
但是,看起来您的链接数据集中的编辑没有将其标记为机器人编辑,因为这些机器人不是approved bots或者因为忘记设置标记。在那种情况下,你运气不好。您仍然可以过滤用户名中的bot
或维基中的known list of bots。