python - 保存sklearn模型的最佳方法是什么？

保存sklearn模型的最佳方法是什么？

时间：2017-10-05 16:59:00

标签： python scikit-learn

我正在开发一个python桌面应用程序。这个应用程序做了一些预测。现在我使用python脚本训练我的sklearn模型，将模型的参数保存为yaml文件中的字典。然后，我将这个yaml构建到我的python应用程序中。然后，当我使用应用程序时，使用字典中的参数重新创建模型。我意识到，拥有不同版本的sklearn的人会收到错误。我试图将我的模型保存在pickle文件中，但在这种情况下，当app在具有不同版本sklearn的机器上运行时，它会产生一些警告。

3 个答案:

答案 0 :(得分：4)

无法保证给定的sklearn模型在sklearn版本之间兼容。实际上，实现或内部API可能会在不同版本之间发生变化。查看更多信息here。

如果您考虑一个版本，最好的方法确实是pickle，而不是将参数保存在yaml文件中。使用joblib这样做会更好。查看更多信息here。

答案 1 :(得分：4)

我意识到，拥有不同版本的sklearn的人会收到错误。

在这种情况下，使用virtualenvs

创建隔离的Python环境

答案 2 :(得分：0)

或者，您可以只从训练有素的模型生成Python代码。这样，您就消除了对象不兼容的任何可能性。这是一个可以帮助您https://github.com/BayesWitnesses/m2cgen

的工具