文本分类工具

时间:2011-04-09 20:59:34

标签: data-mining document-classification

我有兴趣学习文本分类,所以阅读理论。下一步是做东西,因此我在寻找和使用不同的工具。有些链接指向WEKA,但Mallet似乎更适合此任务,但没有人链接到此工具。如果想要在“严肃”项目上工作,有没有理由远离Mallet?我能够使用Mallet快速训练一些分类器并对其进行测试,而使用WEKA时,我使用过滤器在使用其中文本类别命名的地图中转换文本文件后,标签“消失”时遇到问题。

1 个答案:

答案 0 :(得分:0)

这取决于您正在执行的任务。 Mallet也是一种常用的工具,Weka和Mallet都有其优点和缺点。 对于琐碎的任务,两者都很容易使用。我特别喜欢Weka进行聚类和分类任务。

注意:不要被Weka在论坛帖子上的受欢迎所误导,主要是因为它使用的时间较长,而且与Weka相比,Mallet是新的。