文件分类的方法?

时间:2014-03-31 05:32:47

标签: data-mining text-mining

我正在尝试对一堆文件进行分类。到目前为止,我尝试了几种方法:

  • 基于机器学习的方法:如KNN,决策树,SVM等
  • 基于规则:尝试从每个类别的训练语料库中提取一些规则。
  • 基于关键字:尝试从训练语料库中提取关键字以表示每个类别。

还有其他办法吗?

2 个答案:

答案 0 :(得分:0)

在宏观方法方面,仍有一个错过:混合型。您可以尝试合并基于机器学习和基于规则的。文献中有很多关于如何做的文章。

答案 1 :(得分:0)

您可以尝试自然语言处理方法。

更多http://en.wikipedia.org/wiki/Natural_language_processing