HDFS读取压缩的序列文件

时间:2012-04-17 18:32:00

标签: hadoop hdfs

我正在编写一个mapreduce程序,用于在使用bzip2进行块压缩的序列文件中查找一些模式(java regex)。我的扫描不会返回模式匹配结果。我最初的怀疑是我的linux节点上缺少一些原生库来执行此操作,但hadoop fs -text能够解压缩文件并显示输出。

如果未压缩序列文件,则相同的代码可以正常工作。有关问题的任何指示?

0 个答案:

没有答案