如何将hadoop序列文件转换为json格式?

时间:2015-02-04 01:08:44

标签: hadoop hdfs

顾名思义,我正在寻找一些工具,将现有数据从hadoop序列文件转换为json格式。 我最初的谷歌搜索只显示了与jaql相关的结果,我迫切想要开始工作。

Apache是​​否有任何工具可用于此目的?

注意: 我已经将hadoop序列文件放在我的本地机器上,并希望以相应的json格式获取数据。

因此,我正在寻找一些工具/实用工具,它将把hadoop序列文件作为输入并以json格式生成输出。

由于

2 个答案:

答案 0 :(得分:0)

Apache Hadoop可能是读取序列文件的好工具。

但是,除了开玩笑之外,为什么不编写最简单的Mapper java程序,使用Jackson来序列化它看到的每个键和值对?这将是一个非常容易编写的程序。

答案 1 :(得分:0)

我认为必须有一些工具可以做到这一点,因为它有这样的共同要求。是的,它应该很容易编码,但如果你已经拥有了同样的东西,为什么要这样做呢。 无论如何,我想通过jaql做到这一点。样本工作查询对我有用,

read({type:'hdfs',location:'some_hdfs_file',inoptions:{converter:'com.ibm.jaql.io.hadoop.converter.FromJsonTextConverter'}});