如何将具有多行的记录存储到配置单元表中?

时间:2014-10-07 06:56:54

标签: hive

我有一个包含以下数据的数据文件:

10 CLARK,1,265, KING,3,2145, MILLER,2,255
20 ADAMS,2,234, FORD,2,141, JONES,2,425, SCOTT,3,346, SMITH,4,252
30 ALLEN,2,141, BLAKE,3,2145, JAMES,2,255, MARTIN,2,255, TURNER,2,255, WARD,2,255

我需要将它们存储在配置单元表中。由于这些值正在验证,请建议我如何创建一个表来存储这些记录。

任何帮助都会很棒!

1 个答案:

答案 0 :(得分:0)

您可以做两件事:

  1. 如果最大列数是固定的(比如最多20个),那么你有一个包含那么多列的hive表。 Hive会自动为任何特定行中不存在的列分配null。

  2. 您可以做的其他事情是将每一行存储为字符串,查询时可以拆分该字符串。但是这不会很好,因为每次查询时都必须首先拆分然后再运行查询。

相关问题