存储和比较多维向量

时间:2016-05-24 05:57:06

标签: algorithm vector database-design

我有n度的多维向量。处理它们的最佳方法是什么。

  • 存储(存储它们的最佳模式是什么,SQL,Mongo,Document?)
  • 比较(我如何比较其中两个并找到相似性)。

示例:

a{1,3,4,1,-1},
b{2,3,3,0,0},
c{2,3,2,8,9}

如果我们比较上述两项,ab更相似。

如何大规模地做到这一点?我想存储数千个这样的载体。

类似地可以是矢量距离。 Vector Distance

1 个答案:

答案 0 :(得分:2)

我对存储的赌注将在一个Graph数据库上,比如Neo4j。您可以使用Cypher查询计算欧几里德距离(并可能实现k均值聚类以获得最近的点)。

有关实施的详细信息,请查看以下文章 -