随机森林的重要预测变量

时间:2016-08-26 23:54:33

标签: r random-forest

在我的数据集中,我有19个预测变量,包括分类变量和连续变量。我想仅使用重要预测变量(不是所有预测变量)来拟合随机森林模型,并且我还要重复该过程100次。如何通过使用R来完成此操作?有什么建议吗?

1 个答案:

答案 0 :(得分:1)

如果您使用Boruta软件包进行功能选择,请查看此处给出的示例脚本:https://www.kaggle.com/benhamner/liberty-mutual-group-property-inspection-prediction/random-forest-benchmark/run/20397。在第32行,他们使用Boruta包执行特征选择。在第35行,他们获得了那些未被拒绝的功能。在第38行,他们在这个特征子集上训练一个随机森林。