如何启动机器学习模型?

时间:2019-02-20 11:27:25

标签: python machine-learning scikit-learn prediction

首先,感谢您抽出宝贵时间阅读我的问题。我已经使用数据集(著名的有关癌症的数据集)完成了机器学习模型,并且我想知道如何预测新变量的结果。我认为我必须继续训练数据(通常),以便在预测中使用更多准确的数据,但要预测新数据,这就像将测试数据(y变量)更改为新数据一样简单吗? 非常感谢您抽出宝贵的时间,我们将不胜感激。

2 个答案:

答案 0 :(得分:2)

您可能正在使用SVC中的sklearn.svm类。 使用fit方法拟合模型后,可以使用predict方法预测新数据。参见here

顺便说一句:对于支持向量机,您不必多次拟合数据。也许您将其与神经网络混淆了。

答案 1 :(得分:1)

如果您说的是要更改测试数据中功能的数量,那么您就不能这样做。

训练和测试集中的功能数量必须相同。 但是,如果您的测试数据具有训练数据中不存在的一类分类变量,那么最好对您的模型使用一个额外的类别来训练您的模型,即所有功能的“其他”为“无”。

这样,当您在测试数据中遇到新类别的分类变量时,便将其更改为“ NONE”或“ Others”,并在训练后的模型上进行预测。

这种方式不会破坏您的模型。

希望我能正确理解您的问题。