hadoop - reducer采用映射器核心

reducer采用映射器核心

时间：2016-10-01 11:07:05

标签： hadoop mapreduce yarn

我在hadoop集群上运行mapreduce作业，其中包含88个内核和60个reducer。出于某种原因，它只使用79个集群核心。在开始时，它使用79个映射器运行，但是当完成一半分割时，它使用53个映射器和26个减少器，并且运行的映射器的数量继续缩小，这增加了作业完成时间。 Log说这些26个reducer复制计算数据。是否有可能让hadoop首先运行所有映射器并在减速器之后运行？就像在spark或tez作业中一样，他们使用所有核心进行映射，然后使用所有核心进行映射。

1 个答案:

答案 0 :(得分：5)

将mapreduce.job.reduce.slowstart.completedmaps设为1.0。引自mapred-default.xml：

mapreduce.job.reduce.slowstart.completedmaps

0.05

作业中应该在减少之前完成的地图数量的分数计划用于作业。

Hadoop - Reducer到映射器端口
为什么Hadoop映射器和reducer采用类名而不是对象？
对象映射器/核心数据，对象映射器零值字段
ASP.NET核心与EF核心 - DTO集合映射
reducer采用映射器核心
FluentNHibernate映射.Net核心
点网核心自动映射器orderItems
自动映射器9列表映射不起作用asp.net核心
使用.m核心自动映射器将List <Class>映射到List <Class>
EF 核心关系映射

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？