使用不同的分隔符从文件将数据加载到配置单元表

时间:2018-10-17 02:32:06

标签: hive hiveql

我想将数据加载到由字段分隔符“,”创建的配置单元表中。但是我的加载准备文件是“ |”定界的。如何在“加载数据”语法中指定文件中使用的定界符。

2 个答案:

答案 0 :(得分:0)

有两个选项可以管理多个定界符:

  1. MultiDelimiter SerDe
  2. Regexp SerDe

使用MultoDelimSerde,您可以将分隔符定义为

WITH SERDEPROPERTIES ("field.delim"="[,\\|]" 

答案 1 :(得分:0)

我的信誉不足,无法将其标记为可能重复。但是请仔细研究,然后再在此处发布问题。

请参考此较早的主题。 Load data into Hive with custom delimiter