R k-means算法自定义中心

时间:2015-04-13 12:56:38

标签: r k-means

我有一个以R - (x,y)坐标导入的2D数据集。我想在这个数据集上执行k-means聚类,但我想将具体坐标设置为初始中心。例如,我想从5个中心开始,其值为(5, 10), (3, 8), (46, 22), (87, 66), (39, 41)

我在kmeans函数中看到了一个center参数,但我不明白如何将我的值设置为centeres。

kmeans(data, centers = ...) # what to set here?

1 个答案:

答案 0 :(得分:3)

centers参数采用整数k,在这种情况下k来自data的随机点被选为初始中心,或初始中心矩阵,与data一样多的列。试试这个:

x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 2),
                 matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 2))
kmeans(x,centers=3)
kmeans(x,centers=x[1:3,])