Tez总是比MR作为Hive执行引擎更好吗?

时间:2016-08-24 18:58:34

标签: hive

通常对于较小的查询(期望以交互方式,在几分钟内,而不是几小时内),Tez表现更好,批量查询(花费数小时)MR作为执行引擎表现更好吗?或者我们可以说,无论查询类型如何,Tez始终是最佳选择?

1 个答案:

答案 0 :(得分:2)

Tez简化了小规模(低延迟)和大规模(高吞吐量)工作负载的处理。更复杂的查询是TEZ带来的更多好处。对于由单个地图步骤组成的简单查询,它几乎没有任何区别,因为没有什么可以优化的。 TEZ将查询表示为单个作业的DAG(有向非循环图),并消除不必要的步骤,如读取/写入持久存储,对每个Map的输出进行排序,还允许容器重用。 Tez始终是最佳选择,对于简单查询,它不会比MR差,也不会比复杂查询更好。并考虑到这一点:对于MR和TEZ,您必须调整不同的配置参数集,有很多TEZ特定的和许多MR特定的。选择TEZ,即使在没有优化的情况下,您也可以简化生活。另外,Hive-on-MR has been deprecated in Hive 2 releases