对于HIVE查询,OR是否比IN提供更好的性能

时间:2018-11-20 12:38:12

标签: apache-spark hive apache-spark-sql hiveql

我在Hive中有以下两个查询,以获得某些特定结果。

select * from table1 where col1 IN (a, b, c)
select * from table1 where col1=a OR col1=b OR col1=c

根据我的理解, IN 将在内部转换为 OR 的顺序。 在spark-sql中本地执行,但未发现任何性能差异(例如执行时间,过滤数据扫描等)。 因此,我们可以根据功能在IN和OR中看到什么区别。 任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

Col1 in (a,b,c) is a macro that expands to Col1=a or Col1=b or Col1=c.

没有性能差异