H2O中的平均残差偏差公式

时间:2018-11-26 16:36:39

标签: statistics h2o glm gbm tweedie

我正在尝试找出在H2O中用于Tweedie分布的平均残差偏差损失函数的确切公式。

或者,一般来说,Tweedie分布因变量的平均残余偏差是多少?

到目前为止,我已经找到了该页面(http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/glm.html#tweedie-models),其中tweedie分布的偏差公式为:

Tweedie deviance in H2O documentation

但是,在H2O代码内部(位于第103页第{https://github.com/h2oai/h2o-3/blob/master/h2o-core/src/main/java/hex/Distribution.java#L103页的github上),公式的指定方式有所不同(忽略了Ω,它只是权重,并且缺少求和):

2 * w * (Math.pow(y, 2 - tweediePower) / ((1 - tweediePower) * (2 - tweediePower)) - y * exp(f * (1 - tweediePower)) / (1 - tweediePower) + exp(f * (2 - tweediePower)) / (2 - tweediePower))

方程式为:

Tweedie Deviance used in the code

那么,文档是错误的还是实现?我将不胜感激!

谢谢!

1 个答案:

答案 0 :(得分:1)

感谢您指出这一点,尽管位于here的后端方程是正确的(因此实现是正确的),但文档中的方程似乎不正确。我创建了这个Jira ticket来更新文档中的等式。凭单包含正确的方程式以及相关的推论信息。