classification - Weka - 如何查找分类器的输入格式

时间：2013-09-10 18:49:35

标签： classification weka bayesian arff

我在Java程序中使用Weka来对一些文本文档进行分类，并使其与NaiveBayesMultinomial分类器一起使用。

但是我似乎找不到任何关于如何过滤我的实例（或ARFF文件）的文档，以便它们可以被其他分类器接受为输入。如果我将ARFF加载到Weka Explorer GUI中，那么大多数分类器都会显示为灰色。使用StringToWordVector过滤器不会影响这一点，我也尝试过其他一些过滤器。

有谁能告诉我如何准备我的数据，以便其他分类器可以接受，例如NaiveBayes，JRip或BayesNet？

答案 0 :(得分：0)

在WEKA Explorer GUI中，当您应用StringToWordVector时，以前的类属性通常被移动为第一个属性，因此默认情况下它不会被检测为类。当您进入“分类”选项卡时，请确保选择正确的属性作为实验类。

另一个潜在的问题来源是类是数字的，因此阻止了某些算法（期望名义类）的应用。

如果这不能解决您的问题，请发布您的ARFF文件的摘录（标题摘录加一个实例），以便我们提供更精确的建议。