如何找到ARIMA模型的准确性?

时间:2017-08-11 02:52:37

标签: python time-series arima

问题描述:预测CPU利用率 方法:使用时间序列算法。

第1步:从Elasticsearch收集了1000个观察结果并在Python上导出。

第2步:绘制数据并检查数据是否静止。

第3步:使用日志将数据转换为固定格式。

第4步:完成DF测试,ACF和PACF。

第5步:构建ARIMA(3,0,2)模型。

第6步:预测。

我构建了ARIMA (3,0,2)时间序列模型但无法找到模型的准确性。是否有任何命令可以通过它来检查Python中模型的准确性?

如果我的方法是否正确以及如何在Python中找到模型的准确性,请指点一下吗?

2 个答案:

答案 0 :(得分:0)

我一直在对此进行一些研究,遗憾的是,我在python中找不到关于score的{​​{1}}函数。我建议您按照之前site的回答推荐此post

此外,正如答案中所述,“statsmodels确实具有连续因变量的性能指标。”

希望有些极客可以找到并回答,如果我发现任何相关内容,我一定会把它发布到社区。

答案 1 :(得分:0)

方法正确与否-

我希望您能从ACF和PACF中找到最佳的P,Q值。 python中有github代码,可以像自动Arima(自动找到最佳参数)一样工作,因此您不必担心P,q值。基本上取P,Q值,其中模型的BIC最小。

Pyhton代码-

有三个主要指标可用于评估线性模型。它们是:平均绝对误差(MAE),均方误差(MSE)或均方根误差(RMSE)。

MAE :最容易理解。代表平均误差

MSE :与MAE相似,但噪声被夸大,较大的错误被“惩罚”。与MAE相比,它更难解释,因为它不在基本单位内,但是通常更受欢迎。

RMSE :最受欢迎的指标,与MSE相似,但其结果是平方根的,因此它以基本单位为单位时更具解释性。建议将RMSE用作解释模型的主要指标。

下面,您将看到如何计算每个指标。它们全部都需要两个列表作为参数,一个是您的预测值,另一个是真实值-

enter image description here