随机森林中重要特征的统计意义?

时间:2018-07-23 21:52:58

标签: python scikit-learn random-forest

我有一个随机森林分类器,该分类器为我提供了特征重要性等级。

我如何得出重要特征的统计显着性,类似于可以推断beta的统计显着性的回归模型?

1 个答案:

答案 0 :(得分:0)

您的问题有点过于笼统和不清楚。

您可以通过将其值归一化来查看feature_importance_百分比的一种简单方法

importance_sum = sum(clf. feature_importances_)
feature_importance_as_percent =  [100*(x/sum) for x in clf.feature_importances_]

其他方法可能涉及参数或非参数测试。

另请阅读:How are feature_importances in RandomForestClassifier determined?