使用部署模式群集

时间:2016-11-28 15:34:02

标签: apache-spark cluster-computing scheduler

spark-submit使用--master yarn --deploy-mode cluster命令会导致更长的调度程序延迟,而不是使用--master yarn --deploy-mode client

任务绩效结果截图:

enter image description here

这主要涉及在RDD上调用collect操作的作业。

client模式启动的spark应用程序大约需要3到4分钟,而cluster模式需要6到7分钟。阶段中每个任务的大小小于100 KB。 Cluster有8个数据节点并运行Cloudera Manager 5.9.0

1 个答案:

答案 0 :(得分:0)

此特殊情况的解决方案。该问题是由群集基础结构中的以太网电缆断开引起的。更换后,时间大大减少了。

相关问题