高斯西格玛的统计意义

时间:2014-04-01 16:42:53

标签: statistics gaussian significance

我正在研究我的研究中的一个问题,我想用正态分布的西格玛来表示我的统计学意义。例如,如果我的峰值达到95%,则为2sigma。基本上我要问的是说我有一个任意的峰值显着性(例如92%),我如何用正态分布的sigma来表达呢?我意识到这是一个更一般的统计问题,因此鼓励任何阅读/背景。或者,如果Python作为转换/计算的简单函数也可以。 谢谢!

1 个答案:

答案 0 :(得分:0)

我不确定你的意思是什么"相关峰值的统计显着性,"所以我无法评论你所谈论的统计数据是否有意义。然而,听起来你似乎想要计算以下内容:与平均值(比如1.96 sigma)有多少标准偏差覆盖了正态分布的给定分数(在这种情况下,0.95)?如果这是您要求的,您可以使用SciPy统计库轻松解决此问题。如果您还没有SciPy,则需要install it first

一旦安装了SciPy,您就会想要使用正态分布的逆生存函数(ISF)。 ISF是生存函数的倒数,它本身就是1 - CDF。以下是你在python中的表现:

In [1]: import scipy.stats as st
In [2]: yourArea = 0.95
In [3]: st.norm.isf((1-yourArea)/2.)
Out[3]: 1.959963984540054

这就是你如何计算我认为你想要的数字。 (1-A)/ 2业务只是说明CDF从-infinity整合的事实,而您对从分布中心计算的值感兴趣。