K表示聚类在java中找到k个最远点

时间:2013-09-03 03:28:56

标签: cluster-analysis k-means

我正在尝试实现k意味着聚类。

我有一组带坐标(x,y)的点,我正在使用欧几里德距离来寻找距离。我计算了矩阵中所有点之间的距离

dist [i] [j] - 点i和j之间的距离

当我选择离pt 1最远的[1] [3]为3时。

然后当我从3搜索最远时,我可能得到[3] [j],但[1] [j]可能是最小的。

[pt j远离pt3但接近1]

所以如何使用距离矩阵选择k最远点

1 个答案:

答案 0 :(得分:0)

请注意,k-farthest点不一定能产生最佳结果:它们显然不是最佳的聚类中心估计值。

另外,由于k-means启发式算法可能会陷入局部最小值,因此您需要一种随机算法,允许您多次重启该过程并获得潜在的不同结果

您可能需要查看k-means ++,这是k-means初始化的已知良好启发式。