使用Scikit中的K Mean选择要素并恢复要素

时间:2014-10-11 20:18:00

标签: machine-learning scikit-learn cluster-analysis k-means

我想在Scikit中做一些K Mean Clustering。我有9个功能,但我只想在群集中选择其中的四个,因为四个群集中的每一个都是以不同的度量标准来衡量的,我想将每个四个要素标准化为群集。但是,我想以原始形式列出每个数据及其各自的聚类点。我该怎么办?

1 个答案:

答案 0 :(得分:2)

您始终可以使用原始数据点。

重新计算原始数据中的质心,或应用逆归一化(z-归一化是可逆的!);但是你只会获得你使用的四个属性的数据。

重新计算原始数据中的质心是微不足道的,并且会为您提供有关其他属性的信息(如果您可以计算平均值,并且它们不是例如分类;但是您可能希望查看模式代替)