伙计们我是Hive的新手并对此有些怀疑。
通常我们会在Hive中为特定列数编写自定义UDF。 (考虑UDF是Java)。表示它对该特定列执行某些操作。
我想我们可以编写这样的UDF,通过它我们可以将特定列作为某个查询的输入,我们可以从UDF返回该查询,该查询将通过将列作为输入在Hive CLI上执行吗? p>
我们可以这样做吗?如果是,请建议我。 谢谢,抱歉我的英语不好。
答案 0 :(得分:2)
这不可能开箱即用,因为当Hive查询正在运行时,已经构建了一个将要执行的计划。您建议在计划运行时动态更改该计划,这不仅很难,因为计划已经构建,还因为Hadoop MapReduce作业已在运行。
你可以做的是让你的初始Hive查询输出新的Hive查询到一个文件,然后有一些bash / perl / python脚本通过它并制定新的Hive查询并将它们传递给CLI。