标签: algorithm vector database-design
我有n度的多维向量。处理它们的最佳方法是什么。
示例:
a{1,3,4,1,-1}, b{2,3,3,0,0}, c{2,3,2,8,9}
如果我们比较上述两项,a和b更相似。
a
b
如何大规模地做到这一点?我想存储数千个这样的载体。
类似地可以是矢量距离。
答案 0 :(得分:2)
我对存储的赌注将在一个Graph数据库上,比如Neo4j。您可以使用Cypher查询计算欧几里德距离(并可能实现k均值聚类以获得最近的点)。
有关实施的详细信息,请查看以下文章 -