标签: cluster-analysis
我的数据在用户级别包含多个功能。 我希望基于此功能将它们分为几个组 我的数据因某些功能而存在极端离群值。 我的问题是在聚类算法之前进行预处理的最佳实践是什么?
答案 0 :(得分:0)
群集的最佳实践是首先弄清楚如何可靠地测量距离。然后可以尝试许多聚类方法。
但是在量化差异之前,数据不能用于大多数聚类。