在hive表中插入的值,带有来自csv文件的字符串的双引号

时间:2014-05-23 04:38:37

标签: sql csv hadoop hive

我正在将csv文件导出到hive表中。 关于csv文件:列值用双引号括起来,用逗号分隔。

来自csv的样本记录

"4","good"
"3","not bad"
"1","very worst"

我使用以下语句创建了一个hive表,

创建由','分隔的外部表格currys(review_rating字符串,review_comment字符串)行格式字段;

已创建表格。

现在我使用命令load data local inpath加载数据并且它成功了。 当我查询表时,

select * from currys;

结果是:

"4"  "good"
"3"  "not bad"
"1"   "very worst"

而不是

4  good
3  not bad
1  very worst

记录插入双引号,但不应该。

请让我知道如何摆脱这个双引号..任何帮助或指导都非常感谢...

事先谢谢!

1 个答案:

答案 0 :(得分:7)

您使用的是serde吗?如果是,那么您可以在regex中编写SERDE PROPERTIES命令以删除引号。

或者您可以使用here中的csv-serde并定义quote character