如何加速Redshift查询

时间:2014-11-13 11:09:59

标签: psql amazon-redshift

我正在使用json_extract_path_text函数从JSON中提取值。随着行数据的增加,查询需要很长时间才能运行并且会在一段时间内失败。

有没有办法减少查询执行时间或改进josn_extract_path_text函数

2 个答案:

答案 0 :(得分:1)

解决方案是:以表格格式而不是JSON格式存储数据。 JSON不是存储大型数据集的好选择,因为通过将不同的数据存储在单个列中,JSON不会利用Amazon Redshift的列存储架构。或者将节点类型更改为更大的节点类型。

答案 1 :(得分:-1)

Redshift是一个柱状存储,以JSON格式存储数据不会加快查询速度。这适用于文档模型NOSQL数据库,但不适用于RedShift。为了使RedShift查询更有效,基于您拥有的集群数量,表格的分配方式(即使对于数据不遵循特定顺序或随机的方案)也很重要。此外,主键列上的分配键(在其他RDBMS模型中)和相同的排序键可以帮助您加入(它将使用排序合并连接而不是更长的哈希连接)。

有关此内容的更多详细信息,请查看文档。 RTFM是你的朋友。

相关问题