使用WEKA选择Xmeans中的最小和最大簇数

时间:2015-09-08 15:57:32

标签: machine-learning cluster-analysis weka unsupervised-learning

我发现在运行X-means聚类算法之前,WEKA接口需要指定最小和最大数量的聚类。确定这些数字的好方法是什么?是不是X-means应该消除选择集群数量的负担?

1 个答案:

答案 0 :(得分:1)

您可以使用您对数据的任何背景知识来设置最小和最大群集数。 XMeans承担了您的部分负担,因为它不需要您指定数量的集群,但仅绑定集群数。如果您没有背景知识,可以将它们设置为非常低且非常高的值。

例如,如果要在stackoverflow上聚类问题,并且知道分配给每个问题的标记,则可以从标记总数,每个问题的标记等中派生边界。

this question的答案可能有所帮助。一般来说,您必须尝试不同的值,看看哪个会产生您最喜欢的结果。