【问题标题】:Statistical Significance in terms of Gaussian Sigma高斯西格玛的统计意义
【发布时间】:2014-04-01 16:42:52
【问题描述】:
我正在研究我的一个问题,我想用正态分布的 sigma 来表达我对相关峰的统计显着性。例如,如果我的峰值有 95% 的显着性,那么它将是 2sigma。基本上我要问的是说我有一个任意的峰值显着性(例如 92%),我将如何用正态分布的 sigma 来表达这个?我意识到这是一个更一般的统计问题,因此鼓励任何阅读/背景。或者,如果 Python 作为一个简单的函数来转换/计算它也可以。
谢谢!
【问题讨论】:
标签:
statistics
gaussian
significance
【解决方案1】:
我不确定您所说的“相关峰的统计显着性”是什么意思,因此我无法评论您所说的统计数据是否有意义。但是,听起来您想计算以下内容:与平均值(例如 1.96 sigma)有多少标准偏差覆盖正态分布的给定分数(在本例中为 0.95)?如果这是您的要求,您可以使用 SciPy 统计库轻松解决此问题。如果您还没有 SciPy,则需要 install it first。
安装 SciPy 后,您需要使用正态分布的逆生存函数 (ISF)。 ISF 是生存函数的倒数,它本身就是 1-CDF。这是你在 python 中的做法:
In [1]: import scipy.stats as st
In [2]: yourArea = 0.95
In [3]: st.norm.isf((1-yourArea)/2.)
Out[3]: 1.959963984540054
这就是你计算我认为你想要的数字的方式。 (1-A)/2 业务只是说明 CDF 从 -infinity 集成的事实,而您对从分布中心计算的值感兴趣。