Weka - 如何查找分类器的输入格式

时间:2013-09-10 18:49:35

标签: classification weka bayesian arff

我在Java程序中使用Weka来对一些文本文档进行分类,并使其与NaiveBayesMultinomial分类器一起使用。

但是我似乎找不到任何关于如何过滤我的实例(或ARFF文件)的文档,以便它们可以被其他分类器接受为输入。如果我将ARFF加载到Weka Explorer GUI中,那么大多数分类器都会显示为灰色。使用StringToWordVector过滤器不会影响这一点,我也尝试过其他一些过滤器。

有谁能告诉我如何准备我的数据,以便其他分类器可以接受,例如NaiveBayes,JRip或BayesNet?

1 个答案:

答案 0 :(得分:0)

在WEKA Explorer GUI中,当您应用StringToWordVector时,以前的类属性通常被移动为第一个属性,因此默认情况下它不会被检测为类。当您进入“分类”选项卡时,请确保选择正确的属性作为实验类。

另一个潜在的问题来源是类是数字的,因此阻止了某些算法(期望名义类)的应用。

如果这不能解决您的问题,请发布您的ARFF文件的摘录(标题摘录加一个实例),以便我们提供更精确的建议。