在层次聚类中选择群集

时间:2016-05-11 16:31:35

标签: machine-learning hierarchical-clustering

如果一个点与两个不同点的距离相同,我该如何选择一个簇? enter image description here

此处,X1X2X3的距离相同。我可以直接制作X1/X2/X3的群集,或者只是逐个X1/X2,然后X1/X2/X3

1 个答案:

答案 0 :(得分:0)

一般来说,如果你想拥有层次聚类的所有典型属性(如每个“切片通过”的统一含义),你应该总是遵循合并两个规则 - 如果你开始将许多步骤合并为一个,你将拥有“不平衡”结构,因此聚类树的高度在多个地方会有不同的含义。此外,它实际上只对min连接有意义,如果你使用avg链接或其他更复杂的规则,那么它甚至不是真的然后合并两个点后,第三个将是下一个现在添加(它甚至可能结束)在不同的群集中)。但是,一般来说,这种类型的聚类(贪婪)只是一种启发式方法,具有一些特定的属性。因此,交替使用它会为您提供另一个具有某些属性的聚类。说哪一个是“正确的”是不可能的 - 它们在某种程度上都是错误的,重要的是你以后的确切用法。