自动确定簇的数量k-means

时间:2014-11-09 07:56:23

标签: cluster-analysis data-mining k-means rapidminer

我想在快速挖掘器中构建一个集群模型,可以自动定义集群数量,然后继续使用k-means算法。有没有办法在快速矿工中自动确定聚类的k?

1 个答案:

答案 0 :(得分:3)

在k-means中,k的值由用户提供。可以使用聚类有效性度量(例如Davies-Bouldin)来评估所产生的聚类以给出分数。通过改变k,可以产生不同的聚类有效性得分,并且最佳得分(对于Davies-Bouldin最小)将是最有趣的k值的候选者。请点击链接,了解有关如何在RapidMiner Examples中完成此操作的详细信息。

有许多与此相关的警告。最重要的一点是,域专家必须参与检查k的值和生成的聚类是否有意义。