learning_curve绘制的记录不超过200万条

时间:2019-04-05 19:04:57

标签: python python-3.x machine-learning

我正在尝试绘制300万个训练数据的sklearn learning_curve,其中LGBMClassifier是估计量。但是当我绘制learning_Curve时,仅显示到200万条记录。

请在下面找到我的代码:

train_sizes, train_scores, validation_scores = learning_curve(
                                 estimator = lgb_estimator,
                                      X = train,
     y = target, train_sizes = np.linspace(0.1,1,5), cv = 3,
                scoring = 'roc_auc')

plt.style.use('seaborn')

plt.plot(train_sizes, train_scores_mean, label = 'Training error')
plt.plot(train_sizes, validation_scores_mean, label = 'Validation error')

plt.ylabel('MSE', fontsize = 14)
plt.xlabel('Training set size', fontsize = 14)
plt.title('Learning curves for a linear regression model', fontsize = 18, y = 1.03)
plt.legend()
plt.ylim(0.1,1)

请直到这是一种预期的行为,否则我们可以通过sklearn learning_curve绘制任意数量的记录。请让我知道该代码将绘制具有任意数量记录的学习曲线

1 个答案:

答案 0 :(得分:0)

您是否尝试过设置xlim

plt.xlim(0,3000000)
相关问题