KNIME比较数据集

时间:2019-05-07 03:12:29

标签: knime

请您回答:-由于我们使用KNIME来运行我们的要求。在我们的工作流程中,我们将客户数据分为2个数据库(一个oracle和一个Hive)进行比较,然后我们要报告匹配的数据量和不匹配的数据量。因此,现在我们要根据客户的位置对一些客户ID进行分组,以查看从哪个位置我们会出现更多不匹配的情况。您能告诉我应该使用哪些所有节点来获取这种类型的自定义报告

1 个答案:

答案 0 :(得分:1)

不清楚如何进行比较,但我认为您将需要Joiner节点。之后,您可以使用GroupBy节点来使用GroupBy节点来按位置计算不匹配,但是在此之前,您应该使用例如Rule Engine节点来转换创建的缺失值将Joiner 设置为一个值(如果原始数据集在有趣的列中缺少值,则应在 Joiner 之前将其更改),并将所有其他值更改为其他值。