蜂巢。使用动态列加载CSV标题

时间:2015-04-22 08:26:28

标签: hadoop hive

我可以将包含标题的CSV文件加载到hive表中吗文件是否有动态列数? 例如; 我创建了外部表 CREATE EXTERNAL TABLE art_stat(art sting, rate1 string, rate2 string, prop1 string,prop2 string) ...

我有带头文件的CSV文件 File1(只有三个柱):

ART,RATE1,PROP2
apple,109,red
apple,90,green
grape,10,red
......

File2(只有道具columnth):

ART,PROP1,PROP2 
candy,109,black
cooky,90,brown
grape,10,red
......

如何使用标准配置工具将这些文件加载​​到我的表中?

我有一个想法是创建bash脚本,它使用当前列创建临时表,然后将数据从临时表加载到目标表

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

我找到了决定。是否使用动态列的地图类型。 创建表art_data(art string, D map<string,string>)。我制作了自定义SerDe库,将动态格式的csv文件传递给map列的常量格式