优化模型

时间:2020-03-22 03:29:45

标签: python machine-learning scikit-learn random-forest

我对机器学习还是很陌生,正在尝试在Kaggle上进行一些竞赛,即房价竞赛。我按照教程进行了所有操作,效果很好。但是,我在其他地方读到,如果训练成绩的得分比测试成绩的得分高得多,那就表明过拟合。因此,我将随机森林的max_depth调整为3以希望对其进行纠正,并且我的训练得分和测试得分也越来越接近我的期望。但是,当我提交新的csv时,我得到了更差的分数。我的逻辑出了什么问题,我错过了什么吗?我确实注意到培训和考试成绩虽然更接近了,但比以前差了,这是否是我现在身体欠佳的原因?

谢谢!

仅供参考-数字(平均绝对错误):
初始:

Test Score: 21,857
Train Score: 8,584

在max_depth为3之后:

Test Score: 28,745
Train Score: 28,072

0 个答案:

没有答案