hadoop - 使用apache Pig选择文本的一部分 - Thinbug

使用apache Pig选择文本的一部分

时间：2017-02-07 10:18:29

标签： hadoop mapreduce apache-pig bigdata

我有很多小文本文件需要用正则表达式解析，但我只对文本的一部分感兴趣（分隔符是第1节......第n节）。这意味着我需要隔离文本的一部分，之后我可以进行解析。

我想知道我是否可以用Pig隔离部分文字？我想创建自己的UDF，但在开始冒险之前，我来这里是为了提出一些建议。

0 个答案:

没有答案