我正在尝试检索由特定维基百科文章分隔的机器人,注册用户和匿名用户所做的编辑次数. 我知道我可以通过MediaWiki API中的修订版获得文章的所有修订,我想使用rvprop = user来返回进行修订
我知道我可以通过MediaWiki API中的修订版获得文章的所有修订,我想使用rvprop = user来返回进行修订的用户的名称并对检索到的数据进行一些处理.
http://ar.wikipedia.org/w/api.php?action=query&prop=revisions&titles=%D8%A7%D8%A8%D9%86%20%D8%A7%D9%84%D9%86%D9%81%D9%8A%D8%B3&rvlimit=500&rvprop=timestamp%7Cuser|size&format=xml
对于匿名用户修改anon =“”总是发生所以我可以计算它,但对于机器人我找不到办法,据我所知,机器人名称并不总是以标准化方式编写.
知道怎么做吗?或者更简单的方法可能是使用另一个API来完成这项任务?
但是,看起来链接数据集中的编辑没有将它们标记为机器人编辑,因为这些机器人不是approved bots,或者因为忘记设置标志.在那种情况下,你运气不好.您仍然可以在用户名或wiki中的known list of bots中过滤术语bot.