基于模型的聚类的变量选择

时间:2019-05-02 08:55:50

标签: cluster-computing

我有几个需要选择的列变量。问题是,在将重要性变量放入聚类部分之前,该如何选择重要性变量?

以下是我的数据集示例:

https://www.dropbox.com/s/vwt0qrohoqbgcgq/sample_dataset.xlsx?dl=0

我的经验只有一个或两个变量可以聚类。在这种情况下,我有20个变量。

有人对我的案子有同样的问题吗?

注意:

因变量(last_balance,trx_prct,trx_prct_m),其余变量为自变量。

0 个答案:

没有答案