从Wikipedia XML Dump中提取坐标+ Zoomlevel

时间:2011-06-28 22:01:39

标签: wikipedia wikipedia-api

我希望提取维基百科文章的位置信息。 如果文章使用coord模板显示为名称为Coord或coord的模板标记,则相当简单。

然而,较旧的文章可能使用不同的语法,通过这种语法,他们在没有coord模板的情况下将坐标放入信息框。提取坐标很容易,但更难以获得位置的上下文。

有些文章简化了细分参数,有些文章有一个coordinate_type参数,但到目前为止我还没有找到确定相应地图的缩放级别的好方法。

任何人都可以提供帮助吗?

2 个答案:

答案 0 :(得分:1)

所以我的解决方案如下:

首先检查Coord模板。这是最可靠的一个。请注意,您应该只检查具有display:title。

的模板

如果你找不到Coord模板,那么坚持使用旧的latd,Lat_d,lat_degrees参数。

至于缩放级别,尝试在Coord模板或coordinate_type参数中查找类型,该参数可以包含维度,比例和类型以及总体。

如果没有,则需要从其他几个源解析zoomLevel。 我做了人口和面积参数,检查信息框。

答案 1 :(得分:1)

在第一次询问此问题时,不确定维基百科API是否存在。但是,目前您可以查询Wikipedia的API以获取文章的坐标。例如:

http://en.wikipedia.org/w/api.php?action=query&titles=Ann_Arbor,_Michigan&prop=coordinates&format=json

虽然不确定地图缩放级别......