xgb.plot.importance中“ measure”参数的含义是什么

时间:2018-07-02 14:46:21

标签: r xgboost

我试图使用命令

在R中构建xgboost模型
bstSparsedel <- xgboost(data = data,  label = data[,1],max_depth = 6, eta = .3, nthread = 4, nrounds = nrow(train),verbose = 1,early_stopping_rounds = 1)

然后尝试绘制可变重要性图。其中有一个名为measure的参数,它具有三种类型,即覆盖,增益,频率。不同的参数是什么意思?随着图的每次测量完全改变。

我尝试在很多地方寻找。如果您可以共享链接,将很有帮助。

1 个答案:

答案 0 :(得分:0)

来自Understand Your dataset with XGBoost...:

  

增益是指功能对其所处分支的准确性带来的提高。这个想法是,在将特征X上的新拆分添加到分支之前,存在一些错误分类的元素,在对特征X上添加拆分后,有两个新分支,并且每个分支都更准确(一个分支表示是否您的观察结果在该分支上,则应将其分类为1,而在另一分支上则正好相反。

     

Cover度量功能所关注的观测值的相对数量。

     

频率是一种测量增益的简单方法。它仅计算在所有生成的树中使用功能的次数。您不应该使用它(除非您知道为什么要使用它)。