是否有标准方法来查找相关/类似对象?

时间:2014-11-06 06:41:17

标签: algorithm similarity correlated

假设我有一组实体(例如具有其物理特征的人),并且我想为给定的实体X找到与其相关(或类似)的所有实体,以获得相似性的某些定义。

我可以很容易地找到一个维度的这样的实体(所有高度为Y~ = X'高度在一定阈值内的人)但是有一些方法可以用来找到考虑多个属性的类似实体吗?

1 个答案:

答案 0 :(得分:0)

它将取决于您定义为相似性的内容,但您可以使用与1D相同的方法,对任何维度,以及小的概括。假设每个元素都表示为向量,您可以测量2个向量x,yd=|x-y|的距离,并根据此d和某个阈值接受/拒绝。

在这里,减号运算符是向量否定:
(a1,a2,...,an)-(b1,b2,...,bn)=(a1-b1,a2-b2,...,an-bn)
和矢量的绝对值是:
|(a1,a2,...,an)| = sqrt(a1^2 + a2^2 + ... + an^2)

很容易看出这是你的一维示例的概括,并且对具有单个元素的向量调用相同的方法也会这样做。


此方法的缺点是(0,0,0,...,0,10^20)(0,0,0,....,0)相距很远 - 可能会或可能不会是您所追求的,然后您可能需要不同的距离指标 - 但这真的取决于你到底在做什么。