只知道R中的相异矩阵,找到最佳簇数

时间:2015-01-27 10:50:43

标签: r hierarchical-clustering

我有一个相异矩阵,我想使用该矩阵作为唯一输入运行分层聚类,因为我不知道源数据本身。对于背景,我的目标是使用它们的相互关系作为距离来聚类元素。遵循方法在here中指出,我使用相关矩阵来计算作为输入给予hclust的相异矩阵。这很好。

我的问题是:如何找到最佳群集数量?是否有一个可以通过 知道相异矩阵来计算的指数? NbClust中的索引需要运行源数据 - 仅知道不相似矩阵是不够的。我可以在R中使用其他方法吗?

1 个答案:

答案 0 :(得分:0)

通过快速查看 NbClust文档,似乎只能提供省略原始数据源的相异度矩阵。

NbClust(data = NULL, diss = XYZ, distance = NULL ...

当提供矩阵(此处称为XYZ)时,数据和距离必须设置为NULL。这在函数Usage中说明。然后,NbClust应该能够生成您所追求的分区索引。