向量的相似性度量

时间:2013-04-19 08:10:00

标签: math similarity

我想与您讨论哪种相似性措施符合我的要求。我的载体可能看起来像那样:

A = (-4,0,4,null)
B = (-2,null,-4,null)
C = (4,4,4,4)
D = (0,0,0,0)
E = (null,null,null,null)
F = (-4,-4,-4,-4)

值是-5到+5范围内的活动值。值0表示非活动值,值接近-5和+5表示高活动值。所以我正在寻找合适的相似性度量。

我想获得这些载体的所有组合之间的相似性。我认为C和F之间的相似性必须为1,C和D之间的相似性必须为0:

C:E = 0
C:F = 1
C:D = 0
A:B = i think something over 0.5

我希望你能解开我的要求。我现在的问题是:哪种相似性度量可以满足我的要求?

编辑:

  • 0与null不同。 null确实没有定义
  • 相似性度量仅需要计算两个向量之间的相似性

1 个答案:

答案 0 :(得分:1)

这是相当复杂的,首先要使C和F相似,你想要以绝对值开始。同样,看起来null应该被翻译成0。

这将导致元素仅在0..5范围内的向量,这简化了问题。

然后问题是你想怎么做,首先采取组件明智的差异可能是一个好的开始,那么问题是如何将它们加权在一起,随机猜测可能只是线性组合或可能是二次方的

实际上,在最后一步中,它过分依赖于你的用例来说明任何有用的东西,但我认为如果你可以从所有元素进入0..5范围开始,那么就会获得很多。