基于多个分隔符分割文件

时间:2015-03-09 17:14:33

标签: regex hadoop split apache-pig

是否可以使用Pig

基于多个分隔符拆分文件

示例:我有一个文件如下



abc|123>xyz:amd<yts
abd|124>xyz:amc<yts
&#13;
&#13;
&#13;

是否可以根据|,&gt;,:,&lt;拆分并将输出存储为

&#13;
&#13;
abc|123|xyz|amd|yts
abd|124|xyz|amc|yts
&#13;
&#13;
&#13;

由于

1 个答案:

答案 0 :(得分:1)

使用此模式

更容易捕获您想要的内容而不是分割
([^|>:<]+)

Demo