使用AWS Redshift达到数据限制

时间:2017-08-11 10:37:05

标签: sql amazon-web-services amazon-redshift

我正在玩一些SQL代码来实现我为最近加入的公司工作的基本模型。这样做,我的一个SQL查询达到了我的数据磁盘限制,它返回一个错误解释这个。我的问题是,我的运行复杂,大型模型是否阻碍了公司在Redshift上的其他应用程序?我公司是否收到通知我超出了我的限额?

编辑:SQL查询是一些嵌套的SQL查询。错误代码是错误:磁盘已满   代码:1016

1 个答案:

答案 0 :(得分:1)

首先,尝试在不同时运行任何其他查询的情况下运行它:

select
 sum(capacity)/1024 as capacity_gbytes
,sum(used)/1024 as used_gbytes
,(sum(capacity) - sum(used))/1024 as free_gbytes 
from stv_partitions where part_begin=0;

将显示您拥有的可用磁盘空间量。

我的猜测是,如果您的可用空间量相当大,那么如果您在选择大量数据的语句中使用ORDER BY(子查询或最终查询,它不会出现错误),您可能会收到该错误物)。在这种情况下,所有数据都将发送到领导节点,从而导致磁盘溢出。重写没有ORDER BY的语句会有所帮助。