文本分类的特征选择

时间:2013-10-07 08:57:54

标签: python tf-idf text-classification

我正在研究一个文本分类问题,其中选择了100个最常用的单词作为特征。我相信如果我使用更好的特征选择方法,结果会有所改善吗?有任何想法吗? TF-IDF可以工作吗?如果是,那怎么办?

1 个答案:

答案 0 :(得分:0)

改善结果,您可以使用特征选择

1)信息增益

2)Chi square

3)相互信息

4)学期频率

TF-IDF你可以看到这个link它会帮助你