如何在linux中查看Hive orc文件的内容

时间:2013-12-30 20:29:18

标签: linux bash compression hive

有没有办法查看hc 0.11及以上使用的兽人文件的内容。我通常cat gz文件并解压缩它们以查看内容 例如:cat part-0000.gz | pigz -d |更多 注意:pigz是一个并行的gz程序。

我想知道orc文件是否有类似内容。

3 个答案:

答案 0 :(得分:15)

ORC文件转储实用程序附带配置单元(0.11或更高版本):

hive --orcfiledump <hdfs-location-of-orc-file>

Source link

答案 1 :(得分:11)

现在还有一个Linux和MacOS的本机可执行文件,它以JSON格式打印orc文件的内容。查看ORC项目(http://orc.apache.org/)并构建C ++工具。

% orc-contents examples/TestOrcFile.test1.orc

还有一个原生元数据工具:

% orc-metadata ../examples/TestOrcFile.test1.orc

ORC项目还有一个独立的超级jar,可以用Java做同样的事情。

% java -jar orc-tools-1.2.3-uber.jar data myfile.orc

答案 2 :(得分:0)

它还能够通过Linux上运行的桌面应用程序查看ORC文件的内容。

有一个桌面应用程序可以查看Parquet以及其他二进制格式的数据,例如ORCAVRO。它是纯Java应用程序,因此可以在Linux,Mac和Windows上运行。请检查Bigdata File Viewer了解详情。

它支持复杂的数据类型,例如数组,映射,结构等。

enter image description here