标签: hadoop mapreduce apache-pig bigdata
我有很多小文本文件需要用正则表达式解析,但我只对文本的一部分感兴趣(分隔符是第1节......第n节)。这意味着我需要隔离文本的一部分,之后我可以进行解析。
我想知道我是否可以用Pig隔离部分文字?我想创建自己的UDF,但在开始冒险之前,我来这里是为了提出一些建议。