如何从python输出随机森林分类器?

时间:2014-04-10 23:09:42

标签: python scikit-learn random-forest

我已经使用非常大的数据集训练了一个来自Python Sckit Learn Module的RandomForestClassifier,但问题是如何才能保存这个模型并让其他人在它们的末端应用它。 谢谢!

2 个答案:

答案 0 :(得分:24)

推荐的方法是使用joblib,这将导致文件比泡菜小得多:

from sklearn.externals import joblib
joblib.dump(clf, 'filename.pkl') 

#then your colleagues can load it

clf = joblib.load('filename.pk1')

请参阅online docs

答案 1 :(得分:4)

您是否尝试过使用Pickle模块挑选RandomForestClassifier,然后将其保存到磁盘?

以下是基于pickle文档的示例:

import pickle

classifier = RandomForestClassifier(etc)
output = open('classifier.pkl', 'wb')
pickle.dump(classifier, output)
output.close()

然后“其他人”可以按如下方式重新加载腌制对象:

import pickle

f = open('classifier.pkl', 'rb')
classifier = pickle.load(f)
f.close()