将gzip文件的csv文件加载到配置单元中

时间:2017-06-09 06:09:36

标签: amazon-s3 hive

我有一个文件,它是由csv文件组成的gzip格式;我想将数据加载到hive中?我该怎么办?我用textfile创建表并加载,但无法正常工作,还设置了coedc,buit也行不通

1 个答案:

答案 0 :(得分:0)

确保您的文件以.gz

结尾

演示

(在本地文件系统上完成)

<强>的bash

bash$ cat | gzip - >mytable/mydata.gz~
1
2
3

<强>蜂房

create external table mytable (i int);
select * from mytable;
+--------+
|   i    |
+--------+
| (null) |
+--------+

<强>的bash

bash$ mv mytable/mydata.gz~ mytable/mydata.gz

hive

select * from mytable;
+---+
| i |
+---+
| 1 |
| 2 |
| 3 |
+---+