Question

我在下面有一个非常简单的查询，它会计算我们平台上每小时发生的交易次数。

数字是数十亿，所以查询需要一些时间。

因此，我希望能够每小时运行一次查询，将结果附加到另一个表格中 - 这样我们就可以减少延迟时间＆amp;集群上的负载较少。

我可以访问Hue这样做 - 我正在使用Hive。以下是正确的方法吗？

INSERT INTO table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions, 'dpi_datasum' as feed, 'FULL' as environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour

Answer 1

    INSERT INTO table udsuser.healthcheck
    SELECT dt, hour, count(*)as transactions,'dpi_datasum' as feed,'FULL' as 
    environment
    FROM dpi_datasum
    WHERE hour=hour(from_unixtime(unix_timestamp()))-2
    Group by dt, hour

或

    INSERT overwrite table udsuser.healthcheck
    SELECT dt, hour, count(*)as transactions,'dpi_datasum' as feed,'FULL' as 
    environment
    FROM dpi_datasum
    WHERE hour=hour(from_unixtime(unix_timestamp()))-2
    Group by dt, hour

Hive查询结果到新表

1 个答案: