Question

我正在玩一些SQL代码来实现我为最近加入的公司工作的基本模型。这样做，我的一个SQL查询达到了我的数据磁盘限制，它返回一个错误解释这个。我的问题是，我的运行复杂，大型模型是否阻碍了公司在Redshift上的其他应用程序？我公司是否收到通知我超出了我的限额？

编辑：SQL查询是一些嵌套的SQL查询。错误代码是错误：磁盘已满代码：1016

Answer 1

首先，尝试在不同时运行任何其他查询的情况下运行它：

select
 sum(capacity)/1024 as capacity_gbytes
,sum(used)/1024 as used_gbytes
,(sum(capacity) - sum(used))/1024 as free_gbytes 
from stv_partitions where part_begin=0;

将显示您拥有的可用磁盘空间量。

我的猜测是，如果您的可用空间量相当大，那么如果您在选择大量数据的语句中使用ORDER BY（子查询或最终查询，它不会出现错误），您可能会收到该错误物）。在这种情况下，所有数据都将发送到领导节点，从而导致磁盘溢出。重写没有ORDER BY的语句会有所帮助。

使用AWS Redshift达到数据限制

1 个答案: