hadoop - Apache Spark断路器

时间：2018-01-29 10:02:12

标签： hadoop apache-spark yarn

在Hadoop YARN群集中使用Apache Spark 1.6.2。

某些（简单）查询会占用大量资源，我看到我们的开发人员针对1To文件运行SELECT * FROM DB！因此，它需要很长时间，并且＆＃34;阻止＆＃34;所有YARN资源片刻（并在几个小时后大部分时间崩溃......）。

我想知道是否可以限制Spark在YARN群集中运行所消耗的时间/资源：

（不确定＆＃34;断路器＆＃34;是一个好词，我是从弹性搜索中获取的）

答案 0 :(得分：0)

这个问题非常广泛，但总的来说：