Question

我有以下输入整数向量（示例）：

4 138 233 461 610 621 669 742 814 827
89 138 334 656 697 810
138
138 196 738
659 738
4 461
138 337 756 810
8 138 196 337 468 663 664 756 809 810

它们都包含整数值[1-850]并且都存储在csv文件中。

我想根据向量中的相似性将它们分成多个集群，但我对如何在java中为输入数据实现k-means算法感到困惑。有谁愿意帮忙提供技巧或代码？

提前致谢。

Answer 1

k-means聚类的伪代码

假设您有一个度量标准（让我们调用此M），它可以比较输入对象（在您的情况下为向量）并输出相似度量。

和一个函数（让我们称之为A），它能够计算输入对象集合的平均值