预测泊松过程

时间:2011-11-30 17:06:58

标签: statistics machine-learning neural-network classification stochastic-process

我想用泊松分布来预测道路交通的到达时间。目前,我用泊松过程产生(合成)到达时间,使到达时间具有指数分布。

观察过去的数据,我想预测下一个/未来的到达间隔时间。为此,我想实现一种学习算法。

我使用了各种方法,例如贝叶斯预测器(最大后验)和多层神经网络。在这两种方法中,我使用输入特征的一定长度 n 的移动窗口(到达间隔时间)。

在贝叶斯预测器中,我使用到达间隔时间作为二进制特征(1->长,0->短,以预测下一个到达时间 ),而对于神经网络 n -neurons输入层和 m -neurons隐藏层(n = 13,m = 20),我输入 n 先前的到达间隔时间并生成未来的估计到达时间(权重是阈值由反向传播算法更新)。

贝叶斯方法的问题在于,如果到达间隔时间的数量高于,则变得有偏差。因此,它永远不会预测空闲时段(因为 short 的后验总是保持较大。而在多层神经预测器中,预测精度是不够的。特别是对于更高的到达间隔时间,预测准确度会急剧下降。

我的问题是“无法准确预测随机过程(泊松)?或者我的方法不正确?”。任何帮助将不胜感激。

2 个答案:

答案 0 :(得分:5)

如果它真的遵循泊松分布,则只能预测下一个交通项目将以给定间隔到达的概率 - 概率曲线只是归一化积分(即带有1)泊松分布的渐近线。为什么所有关于神经网络/贝叶斯预测器的混乱?

答案 1 :(得分:5)

那么,如果生成过程是一个齐次的泊松过程,那么预测的并不多,对吧?速率参数在整个时间内保持不变,并且可以通过简单估计但过去,最近的历史应该对到达时间没有影响。你使用的是最近到达的二元特征,但齐次泊松过程的全部意义是到达指数是指数,指数分布是无记忆的。

现在,如果同质假设不正确,您需要更多地考虑细节,答案取决于您希望用于该过程的平均度量。看看考克斯过程(双随机泊松过程,其中平均测量也是一个随机变量)或可能是霍克斯过程(每次到达都会导致一系列进一步的活动)。