Hive查询结果到新表

时间:2018-01-31 09:33:54

标签: sql hadoop hive hiveql

我在下面有一个非常简单的查询,它会计算我们平台上每小时发生的交易次数。

数字是数十亿,所以查询需要一些时间。

因此,我希望能够每小时运行一次查询,将结果附加到另一个表格中 - 这样我们就可以减少延迟时间&集群上的负载较少。

我可以访问Hue这样做 - 我正在使用Hive。以下是正确的方法吗?

INSERT INTO table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions, 'dpi_datasum' as feed, 'FULL' as environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour

1 个答案:

答案 0 :(得分:0)

    INSERT INTO table udsuser.healthcheck
    SELECT dt, hour, count(*)as transactions,'dpi_datasum' as feed,'FULL' as 
    environment
    FROM dpi_datasum
    WHERE hour=hour(from_unixtime(unix_timestamp()))-2
    Group by dt, hour

    INSERT overwrite table udsuser.healthcheck
    SELECT dt, hour, count(*)as transactions,'dpi_datasum' as feed,'FULL' as 
    environment
    FROM dpi_datasum
    WHERE hour=hour(from_unixtime(unix_timestamp()))-2
    Group by dt, hour