基于粗糙集的属性约简

时间:2010-12-08 13:45:41

标签: math classification

我尝试了RSAR,一个免费软件包,但我想知道是否还有其他好的属性缩减器。甚至R或matlab的包,任何能够让我找到最小的属性集的资源都会对数据进行分类。例如,有一个包含数百个邮件和不同属性的例子,描述它们并被分类为垃圾邮件或非垃圾邮件,我想找到描述所有数据的最小属性集,以丢弃无用的信息。

我希望自己能够自我解释,如果没有,我愿意接受你的建议。

感谢。

2 个答案:

答案 0 :(得分:0)

考虑您描述的问题类型,即:为电子邮件分类选择正确的属性,最好的方法可能是使用Weka(Weka home)。它有几种特征选择算法,可以交互式应用以显示其效果,或与各种分类算法结合使用,以评估它们对实际分类的影响。 (请注意,在没有对特定分类器进行适当验证的情况下选择分类属性可能会导致现实生活中的结果不尽如人意。)

一些相关链接:

Weka's manual regarding attribute selection

A (somewhat outdated) hands-on example

答案 1 :(得分:0)

你可以使用R语言的R语言包。请参阅R中的FS.one.reduct.computation说明(安装RoughSet包后)

例如:HIRING2Matrix是具有多个属性的决策表。 reduct1是减少的属性集

reduct1< - FS.one.reduct.computation(HIRING2Matrix,greedy = TRUE,power = 1)