蜂巢 - 创建表

时间:2017-12-27 01:09:20

标签: hiveql

我需要在配置单元中创建一个表来插入如下所示的数据:

第1列 - 帐户ID字符串(11个字符) 第2栏 - 年龄int 第3栏 - 重复account_id

数据存储在由空格分隔的文本文件中,但最后一列将具有多个值,因此进行查询如果该列中存在该值,则需要消除该行

示例文本文件:

Thomsxx3125 25 Davidxx3125 Raghuxx3125 Vijayxx3125 Gracexx3125

请在此感谢您的帮助。

1 个答案:

答案 0 :(得分:0)

您不能创建重复的列名。 这是一个有效的查询:

create table if not exists name_of_table
(
account_id string comment '11 characters',
age int,
account_id2 string
)
fields terminated by ' '
stored as textfile;

您还可以参考Hive的官方文档: https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-CreateTable

相关问题