有没有办法在* country * grain(而不是简单的语言)中获得每页的维基百科综合浏览量统计数据?

时间:2015-02-11 21:01:12

标签: wikipedia wikimedia wikimedia-dumps

例如,我看到dumps.wikimedia.org/other/pagecounts-raw/,但没有特定国家/地区的数据......

1 个答案:

答案 0 :(得分:2)

据我所知,没有。出于明显的隐私原因,发布的页面查看统计信息不包含任何IP地址信息,因此无法告知请求来自哪里

那就是说,我认为可能可以让WMF Analytics Team提供这样的统计数据,或者至少有一些粗略的近似值,如果有足够的人要求它们的话。 Apparently,维基媒体已经拥有一个IP地理定位数据库,用于其他目的(例如本地事件通知和筹款活动),因此这部分可能不会像其他情况那样难以实现。绝对的请求数量和潜在的隐私泄漏可能仍然存在问题(例如,如果他们编辑了一个很少查看的页面而没有其他人查看报告间隔,则泄漏编辑的居住国家/地区),但这些可能会被处理,例如通过仅对所有请求的统计样本进行地理定位,并将很少查看的页面的统计数据汇总到一个“其他”组中。

我怀疑主要的问题是维基媒体,作为一个主要由捐赠支持的志愿者非营利组织,是否真的会考虑提供这些统计数据所需的所有工作。不过,我不认为这可能会让你受伤。