BigQuery的查询非常慢

时间:2013-05-21 19:46:51

标签: google-bigquery

我有一张16亿行的表。我一直在运行一个查询,它使用一个包含超过500万个唯一值的分组字段,然后按降序排列另一个整数值的总和,最后只返回前10个。请注意,超过一个小时后,该查询是仍处于运行状态。

我使用“bq cp -a”创建了这个大表。最初这些源表是来自1000个较小表的“bq cp”,每个表都是从超过12个压缩的csv加载文件加载的。

我搜索了相关问题,发现“Google BigQuery is running queries slowly”提到由于大量小量摄入造成的碎片造成的缓慢。我的数据传播方法是否在摄取过程中被视为“太小的数据位”而导致碎片化?

可能有500万个唯一值太多,这是响应缓慢的根本原因吗?

1 个答案:

答案 0 :(得分:0)

我们昨天有一个延迟峰值,今天有一个较小的延迟峰值。您是否可以提供项目ID +查询作业的工作ID,这些工作时间比您预期的要长?

相关问题