Question

我有类似的Hive SQL

select 5 in (1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20);

当我解释它的时候，它告诉我蜂巢会扫描这个：

== Physical Plan ==
*(1) Project [true AS (5 IN (1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20))
+- Scan OneRowRelation[]

这是否意味着配置单元将执行序列扫描而不是在该集合上查找集合（这会导致性能下降）？

Answer 1

答案可以在执行中找到 org.apache.hadoop.hive.ql.udf.generic.GenericUDFIn。

简单地说，它取决于括号中的args。具体来说，它们是否都是常量。

有关更多详细信息，请参见此处的代码：GenericUDFIn。

祝你有美好的一天：）