我在下面有一个非常简单的查询,它会计算我们平台上每小时发生的交易次数。
数字是数十亿,所以查询需要一些时间。
因此,我希望能够每小时运行一次查询,将结果附加到另一个表格中 - 这样我们就可以减少延迟时间&集群上的负载较少。
我可以访问Hue这样做 - 我正在使用Hive。以下是正确的方法吗?
INSERT INTO table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions, 'dpi_datasum' as feed, 'FULL' as environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour
答案 0 :(得分:0)
INSERT INTO table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions,'dpi_datasum' as feed,'FULL' as
environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour
或
INSERT overwrite table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions,'dpi_datasum' as feed,'FULL' as
environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour