Rapidminer中的交叉距离给问号

时间:2018-07-29 11:48:02

标签: rapidminer

我正在使用Rapidminer使用交叉距离比较同一excel文件中两张纸之间的相似度,因为我要比较一个请求,所有参照都将通过余弦相似度返回相似度值,问题是距离返回为问号find_in_set()不知道原因。

处理XML:

?

流程概述: enter image description here

1 个答案:

答案 0 :(得分:0)

最可能的原因是,数据中的某处具有无限值。对于它们,余弦距离没有定义,因此您得到一个“?”也就是您的结果缺少价值。

在这种情况下,可以在计算之前使用Replace Infinite Values运算符。