我在作业中运行了100个mapper和1个reducer。如何提高工作绩效?
根据我的理解:使用组合器可以在很大程度上改善性能。但是我们还需要配置什么才能提高工作绩效?
答案 0 :(得分:2)
由于此问题中的数据有限(输入文件大小,HDFS块大小,平均地图处理时间,Mapper插槽数量和群集中的缩小插槽等),我们无法提出建议。
但是有一些提高性能的一般指导原则。
更多提示:
LongWritable
范围内时,请勿使用Integer
。IntWritable
是正确的选择在这种情况下)Writables
请查看此cloudera文章,了解更多提示。