H2O随机森林制成的样本树中的预测值

时间:2019-03-25 22:13:56

标签: random-forest h2o

目前,我正在通过H2O软件包进行随机森林分析,并绘制了一个用于演示目的的示例树。每个节点的预测值与该节点所有实例上的正分类概率不太相同。

只是想知道H2O如何计算预测值。我需要一个公式来得出这个预测!我知道随机森林超出了树木预测的平均值。但是,如何在每棵树的每个节点上计算此预测?

任何帮助将不胜感激。

2 个答案:

答案 0 :(得分:0)

请参阅统计学习元素中的算法15.1:

然后查看在H2O-3中实施模型训练过程的代码:

最后,了解如何使用实际生成的模型产生分数的最好方法是在此处找到genmodel MOJO实现(尝试使用Java调试器单步执行对score0()的调用): / p>

答案 1 :(得分:0)

我找到了一个解决方案,该解决方案将火车数据集的确切概率率作为样本树中的预测值返回。您只需要将代码设置如下: h2o.randomforest(sample_rate = 1, calibrate_model = TRUE, and calibration_frame = train )

相关问题