登录Elastic Map Reduce的最佳实践 - AWS

时间:2016-06-30 14:39:02

标签: amazon-web-services hadoop spark-streaming amazon-emr

我计划将Amazon EMR用于火花流应用程序。亚马逊提供了一个很好的界面来显示stderr&控制器日志。但对于流媒体应用程序,我不确定如何管理日志。

亚马逊将数据记录到/var/log/hadoop/steps/<step-id>以及类似的地方火花。 http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-manage-view-web-log-files.html

我想知道如何旋转日志,仍然可以通过aws emr web界面访问。我们可以通过配置hadoop-log4j轻松更改日志轮换策略,但这样我无法通过Web界面访问它。此外,EMR应管理日志s3上传

1 个答案:

答案 0 :(得分:-1)

AWS EMR还将日志存储在S3中。

导航到正在运行的群集的群集控制台,在左侧中间列中,您将看到s3存储桶的路径。

小心不要为将来的群集重用相同的s3存储桶路径,否则您可能会覆盖日志数据。