weka中看不见的名义价值

时间:2013-11-28 05:53:59

标签: machine-learning weka supervised-learning

我有一个带有一些标称值作为特征的数据集。我所拥有的训练集有一组标称特征的值,这些值在我的测试集中是不存在的。 例如,我在训练集中的特征对应于

@attribute h4 {br,pl,com,ro,th,np}

和测试集中的相同功能

@attribute h4 {br,pl,abc,th,def,ghi,lmno}

我相信因此,weka不允许我重新评估我在我的测试集上训练集上建立的模型。有没有解决的办法?我错过了什么吗?

编辑:我正在使用RandomForest分类器。

由于

1 个答案:

答案 0 :(得分:5)

Weka寻求测试集中使用的所有名义值也存在于训练集中,因为分类器在进行预测之前应该学习。

Weka也使用名义价值及其指数;因此,对同一属性的名义值使用相同的顺序以获得可靠的结果非常重要。

在您的情况下,只需使用相同的值 - 涵盖所有值 - 以相同的顺序训练集和测试集。

您的组合值{br,pl,com,ro,th,np,abc,th,def,ghi,lmno}可用于训练集和测试集。