scikit-learn - K均值聚类：如何确定哪些变量会影响聚类？

PCA创建主要成分，从本质上可以将其视为基本特征的一些线性组合，以帮助将维数从您的情况下的86个特征减少到变化最大的19个“主要成分”。 >

为了了解这些主要组件所基于的区分功能，您必须深入了解PCA的功能。简而言之，PCA对86个特征的相关矩阵进行特征分解。然后将数据投影到一个新的向量空间，该向量空间由19个特征值最高的特征向量组成。

为了粗略估计PCA认为“主要”的特征，可以手动对相关矩阵进行特征分解，并查看哪些特征的特征值最高。但是，请记住，这不会是1-1的相关性，因为PCA使用这86个特征的某种线性组合来降低尺寸。但是，本征分解也许可以帮助您更好地理解数据。