将距离矩阵传递给sklearn中的k均值聚类

时间:2017-04-20 07:22:43

标签: python algorithm cluster-analysis k-means

sklearn kmeans documentation一样,它表示k-means需要一个shape =(n_samples,n_features)矩阵。但我提供了一个shape =(n_samples,n_samples)的距离矩阵,其中每个索引保持两个字符串之间的距离。时间序列已使用SAX表示形式转换为字符串。

当我使用距离矩阵运行聚类时,它会产生良好的结果。可能的原因是什么?据我所知,K-medoids是与距离矩阵一起工作的。

1 个答案:

答案 0 :(得分:4)

K-means,如名称所示,使用表示

计算算术平均值需要访问原始要素,不能使用距离矩阵。

K-means 不使用成对距离。因此,距离矩阵对于该算法是无用的。

请选择其他算法,例如分层聚类。