来自线性模型的残差的平均值和中值

时间:2012-09-17 14:22:29

标签: r mean

我刚刚开始学习R并且需要一些帮助来找到我的数据的残差的均值和中位数。我计算了lm,在摘要中我得到了如下残差:

min       1Q        median  3Q      Max
-111.86   -34.90     -7.6   33.46   182.58

问题:所以残差的中位数是-7.6,但这是我的意思? 或者是否有计算残差的均值和中位数? 我打算做意思(resid(trees.lm)或者应该输入为mean(trees.lm $ resid)

请澄清,因为我的同学对同一数据集的反应都不同。

1 个答案:

答案 0 :(得分:6)

这里的一个具体问题的答案是:

mean(resid(trees.lm))

您不应该深入研究这样的拟合模型对象并去除任意组件。当你意识到你刚刚通过以下方式提取工作残差时,就像GLM这样复杂的事情会让你大吃一惊:

glm.mod.obj$residuals

对你不太可能有用。

即使对于lm()个对象这样的简单内容,使用resid()或访问$residuals的内容也可能会有所不同,具体取决于模型的拟合方式({{1}的设置是什么例如,参数?)。

此外,线性模型假设残差为i.i.d.高斯(或正常)随机变量,均值为0,方差为$ \ hat {\ sigma} ^ 2} $所以均值应非常接近0(即非常非常非常接近0但不完全是因为这是一台计算机和浮点运算正在发挥作用。)

相关问题