测试示例集属性应该等于OR Superset of Training示例集Rapidminer SVM

时间:2015-12-08 09:01:39

标签: svm rapidminer

我是Rapid Miner的新手并且在其中使用SVM Linear。我的模型如下:
enter image description here

我制作了训练样例集,其中包含3552个示例和2个属性,我正在进行名义到数字转换,通过SVM线性模型然后在应用模型中连接模型输出。这可以。

在测试示例集中,我有735个示例,其中包含2个属性并进行名义到数字转换,然后将此转换后的示例集应用于应用模型。在这个阶段,当我运行该过程时,我收到一个错误,其中说:

enter image description here

我搜索了很多关于这一点,但没有找到正确的方向。我将感谢你的帮助。

1 个答案:

答案 0 :(得分:2)

Nominal to Numeric运算符将生成新属性,其名称将从输入属性的值派生。当dummy encoding用于coding type参数时会发生这种情况。如果测试数据与训练数据相比包含不同的值,则结果属性将不同。

要确认这是问题所在,请在Nominal to Numeric运算符后设置断点并检查每个示例集的属性。

您可以通过将参数设置为unique integers来更改操作员的工作方式,但这可能不适合您要解决的问题。

解决这个问题的一种可能方法是合并两个数据集,然后再将它们拆分。这具有为每个标称属性创建允许级别的效果,即使数据可能没有该值的示例。然后,每个拆分可以与Nominal to Numeric运算符一起使用,它应该创建所有必需的属性。