随机森林:如何输出给定点的重要变量

时间:2016-04-28 18:55:25

标签: r classification random-forest

我的随机森林分类模型包含500个决策树,并训练了200个变量和10,000个数据点。每个决策树负责200维参数空间中的特定子区域,并由若干输入变量表示。 我想实现两件事: - 识别500个决策树中的哪一个与给定点X相关 - 决策树中包含的变量输出列表。 理想情况下,它应该是单个函数调用:

list_of_variables< - getSignificantVariables(RF,X)

其中RF是随机森林模型,X是训练(或测试)数据集中的一行。

我尝试在RandomForest包中使用现有的API。函数GetTree(n)输出一个表,其中包含与树编号n相关的信息。可以将变量名称与从表中获取的变量号相关联。但是,我们如何识别500个决策树中的哪一个与给定点X相关?

0 个答案:

没有答案