我有大量的属性(~110.000)和大约80个实例,我想要聚类。属性具有distict值,通常为0和1 ..我想删除所有经常显示的属性或几乎从不,例如80个实例中的78个或80个实例中的2个值为0/1的属性。在weka中有什么方法可以做到这一点吗?
答案 0 :(得分:0)
在“预处理”选项卡中,有一个“removeUseless”属性过滤器。
请参阅过滤器/无监督/属性/ removeUseless。你试过吗?
来自说明:
“此过滤器会删除完全不变或变化的属性 太多了。“
这可以通过调整maximumvariancePercentageAllowed
参数来完成。默认值为99%。