如何预处理集群weka的数据

时间:2015-12-05 16:46:23

标签: attributes instance cluster-analysis weka large-data

我有大量的属性(~110.000)和大约80个实例,我想要聚类。属性具有distict值,通常为0和1 ..我想删除所有经常显示的属性或几乎从不,例如80个实例中的78个或80个实例中的2个值为0/1的属性。在weka中有什么方法可以做到这一点吗?

1 个答案:

答案 0 :(得分:0)

在“预处理”选项卡中,有一个“removeUseless”属性过滤器。

请参阅过滤器/无监督/属性/ removeUseless。你试过吗?

来自说明:

  

“此过滤器会删除完全不变或变化的属性   太多了。“

这可以通过调整maximumvariancePercentageAllowed参数来完成。默认值为99%。