statistics - 预测泊松过程

时间：2011-11-30 17:06:58

标签： statistics machine-learning neural-network classification stochastic-process

我想用泊松分布来预测道路交通的到达时间。目前，我用泊松过程产生（合成）到达时间，使到达时间具有指数分布。

观察过去的数据，我想预测下一个/未来的到达间隔时间。为此，我想实现一种学习算法。

我使用了各种方法，例如贝叶斯预测器（最大后验）和多层神经网络。在这两种方法中，我使用输入特征的一定长度 n 的移动窗口（到达间隔时间）。

在贝叶斯预测器中，我使用到达间隔时间作为二进制特征（1->长，0->短，以预测下一个到达时间长或），而对于神经网络 n -neurons输入层和 m -neurons隐藏层（n = 13，m = 20），我输入 n 先前的到达间隔时间并生成未来的估计到达时间（权重是阈值由反向传播算法更新）。

贝叶斯方法的问题在于，如果短到达间隔时间的数量高于长，则变得有偏差。因此，它永远不会预测长空闲时段（因为 short 的后验总是保持较大。而在多层神经预测器中，预测精度是不够的。特别是对于更高的到达间隔时间，预测准确度会急剧下降。

我的问题是“无法准确预测随机过程（泊松）？或者我的方法不正确？”。任何帮助将不胜感激。

答案 0 :(得分：5)

如果它真的遵循泊松分布，则只能预测下一个交通项目将以给定间隔到达的概率 - 概率曲线只是归一化积分（即带有1）泊松分布的渐近线。为什么所有关于神经网络/贝叶斯预测器的混乱？

答案 1 :(得分：5)

那么，如果生成过程是一个齐次的泊松过程，那么预测的并不多，对吧？速率参数在整个时间内保持不变，并且可以通过简单估计但过去，最近的历史应该对到达时间没有影响。你使用的是最近到达的二元特征，但齐次泊松过程的全部意义是到达指数是指数，指数分布是无记忆的。

现在，如果同质假设不正确，您需要更多地考虑细节，答案取决于您希望用于该过程的平均度量。看看考克斯过程（双随机泊松过程，其中平均测量也是一个随机变量）或可能是霍克斯过程（每次到达都会导致一系列进一步的活动）。