分析剩余正态概率图

时间:2019-04-20 02:07:58

标签: matplotlib plot normal-distribution

这是一个非常基本的问题。我想分析线性回归模型的标准化残差。因此,我做了如下的残留正态概率图:

model = LinearRegression(fit_intercept=True)
x = df.temp
x = np.asarray(x).reshape(-1, 1)
model.fit(x, df.RH)
y_predicted = model.predict(x)
residual = df.RH - y_predicted
residual = (residual - np.mean(residual)) / np.std(residual)

fig, ax = plt.subplots(figsize=(5,5))
fig = plt.title("Normal Probability Plot")
fig = sp.stats.probplot(residual, plot=ax, fit=False, dist='norm')

enter image description here

此图中有一些异常值。然后,我只是从原始数据中删除所有异常值,并得到相同的结果。那我怎么解释这个情节呢?我可以认为这是离群值吗?或者我可以假设残差近似为线性,从而支持误差项呈正态分布的条件?

0 个答案:

没有答案