如何根据ip获取国家/地区名称

时间:2013-10-08 11:02:14

标签: hadoop geolocation ip apache-pig

我有一个IP地址列表。我需要为每个IP分配一个国家/地区。 例如http://www.ip2nation.com/提供此服务。 我找到了一些IP2Country的数据库,但是如何将它与猪一起整合?

输入:

14.59.63.28
145.89.87.211
54.27.253.89
98.201.50.22
116.48.29.143
145.89.87.211
20.109.204.65
20.109.204.65

预期产出:

14.59.63.28     country1
145.89.87.211   country2
54.27.253.89    country3
98.201.50.22    country4
116.48.29.143   country5
145.89.87.211   country2
20.109.204.65   country6
20.109.204.65   country6

1 个答案:

答案 0 :(得分:0)

您需要从该数据库中获取IP数据库和国家/地区名称。 然后使用提取的数据与您流式传输的数据进行连接。

我会直接加入。为了获得更好的性能,您可以检查Pig中的复制连接 http://pig.apache.org/docs/r0.7.0/piglatin_ref1.html#Replicated+Joins