求残差之和

时间:2019-09-23 09:34:20

标签: python regression statsmodels poisson

我正在练习Fresco Play中使用Python进行的Poissons Stats回归练习。     问题陈述如下:     从MASS包中加载R数据集保险。     将数据捕获为熊猫数据框。     用自变量的对数建立泊松回归模型     持有人和因变量Claims。     用数据拟合模型,找到残差之和。

我停留在最后一行,即剩余总和

我使用了np.sum(model.resid)。但是答案不被接受

这是我的代码

import statsmodels.api as sm
import statsmodels.formula.api as smf
import numpy as np

INS_data = sm.datasets.get_rdataset('Insurance','MASS').data
model = smf.poisson('Claims ~ np.log(Holders)', INS_data).fit()
print(np.sum(model.resid))

3 个答案:

答案 0 :(得分:0)

我在Python2中运行的代码给出了错误的答案,但在Python3中运行了给出了正确的答案。我不知道原因,但是代码可以在Python3中完美运行

答案 1 :(得分:0)

对于残差,您可以使用残差的基本概念,即实际-预测

这是代码段。

import statsmodels.api as sm
import numpy as np
import statsmodels.formula.api as smf
Insurance = sm.datasets.get_rdataset('Insurance','MASS')
data = Insurance.data
data['Holders_'] = np.log(data['Holders'])
model = smf.poisson('Claims ~ Holders_',data).fit()
y_predicted = p.predict(data['Holders_'])
residual = (data['Claims']-y_predicted)
print(sum(residual))

output

答案 2 :(得分:-1)

经过大量的搜索之后,我知道它期望累积的总和,所以使用 np.cumsum(model.resid) 它将在Frescoplay中通过