双峰分布表征算法?

时间:2011-03-27 17:53:09

标签: random statistics histogram

在一组样本中,可以使用哪些算法来表征预期的明显双峰分布,比如两个正态分布的混合,这些分布具有良好分离的峰?吐出2意味着,2个标准偏差和某种稳健性估计的东西将是期望的结果。

我对可以用任何编程语言(对于嵌入式控制器)实现的算法感兴趣,而不是现有的C或Python库或stat包。

如果我知道两种模态方法的差异大约为3:1 + - 50%,标准偏差相对于峰值间隔“小”,会更容易吗,但这对峰值可能在任何地方在100:1范围内?

1 个答案:

答案 0 :(得分:2)

这里有两种不同的可能性。一个是你有一个双峰分布。另一个是您正在观察来自两个不同发行版的数据。估计后者的通常方法是,不出所料,称为mixture model

如果您想采用贝叶斯视图来解决问题,那么您的估算方法是使用最大似然法或使用马尔可夫链蒙特卡罗方法。如果您更详细地陈述您的假设,我愿意帮助您尝试找出您想要尝试和最大化的目标函数。

这些类型的模型可能是计算密集型的,因此我不确定您是否想尝试在嵌入式控制器中执行整个统计方法。黑客可能更适合。如果峰值实际上是分开的,我认为更容易尝试识别两个峰值并在它们之间分割数据并独立估算每个分布的均值和标准差。

相关问题