amazon-web-services - 自动归档aws-redshift表的最佳方法

时间：2018-03-22 18:41:32

标签： amazon-web-services amazon-s3 amazon-redshift amazon-data-pipeline data-pipeline

我在红移中有一个大表我需要自动化存档月度数据的过程。

目前的方法如下（手册）：

我需要自动化这种方法，
使用aws数据管道是一个好方法吗？请建议任何其他有效的方法，例如赞赏。

感谢您的帮助！

答案 0 :(得分：1)

我建议的方法是在一个小实例中设置气流来运行调度。或者，如果工作太多，请设置一个crontab。

我建议使用gzip格式并将大小限制为每个文件大约20-100mb

这样数据就在红移之外，但是只要你需要就可以从redshift访问。

答案 1 :(得分：1)

我不知道亚马逊认为这种情况是否足以建议实践，但这里有几种选择（注意：流行的共识似乎是数据管道对于简单的数据加载很有用，但它不是'用作归档方法。）

我没有遇到有关此类数据副本的任何最佳做法。