无法处理猪的Xml

时间:2016-06-16 11:01:15

标签: java xml apache-pig hadoop2 bigdata

我是猪的新手。我在处理XML文件时遇到了问题,下面的命令就是我用过的:

register '/usr/lib/pig-0.12.0/contrib/piggybank/java/piggybank.jar'
pigdata = load '/xml1.xml' using org.apache.pig.piggybank.storage.XMLLoader('name') as (doc:chararray);

values = foreach pigdata GENERATE FLATTEN(REGEX_EXTRACT_ALL(doc,'<name>(.*)</name>')) AS (name:chararray);

dump values;

Screen shot of error encountered

1 个答案:

答案 0 :(得分:0)

此问题可能是由于文件路径问题和/或权限问题引起的。可以请检查/user/edureka/xml1.xml中是否存在输入文件的hdfs文件路径。您还可以手动检查是否能够在hdfs:// localhost:8020 / tmp目录等中创建新文件以排除权限问题。

相关问题