猪的MultiStorage文件内容

时间:2014-07-04 00:17:50

标签: hadoop apache-pig

我有一个目录,其中的文件包含一些邮件格式的日志(NEWLINE分隔),我想在每一行中选择特定的位置并将其用作目录/文件名

下面的代码只是文件并且做了我期望的,问题是子字符串现在在新文件中,有没有办法在文件中存储B $ 1使用B $ 0作为文件名意味着保留原始文件文件内容是什么?

REGISTER /lib/pig/piggybank.jar;

A = LOAD '/raw/*' USING PigStorage('\n') AS (mytext:chararray);
B = FOREACH A GENERATE SUBSTRING(mytext,5,7), mytext;
STORE B INTO '/output' USING org.apache.pig.piggybank.storage.MultiStorage('/output', '0', 'none', ' ') ;

0 个答案:

没有答案
相关问题