用Excel计算统计显着性

时间:2009-08-05 11:17:43

标签: excel comparison statistics measurement significance

我在excel中有2列和多行数据。每列代表一种算法,行中的值是具有不同参数的这些算法的结果。我想用excel对这两种算法进行统计显着性检验。任何人都可以建议一个功能吗?

因此,如果说“算法A的执行率比算法B高8%,概率为9(或95%置信区间)”,那就太好了。

维基百科文章准确地解释了我的需求: http://en.wikipedia.org/wiki/Statistical_significance

这似乎是一项非常简单的任务,但我找不到科学的测量功能。

对于excel或功能片段的内置功能的任何建议都表示赞赏。

谢谢..

编辑:

在tharkun的评论之后,我意识到我应该澄清一些观点: 结果仅为1-100之间的实数(它们是百分比值)。由于每行表示不同的参数,因此行中的值表示此参数的算法结果。结果不依赖于彼此。 当我对算法A和算法B的所有值取平均值时,我看到算法A产生的所有结果的平均值比算法B高10%。但我不知道这是否具有统计意义。换句话说,对于一个参数,算法A得分比算法B高100%,而其余算法B得分较高,但仅仅因为这一结果,平均差异为10%。 我想用excel做这个计算。

1 个答案:

答案 0 :(得分:3)

感谢您的澄清。在这种情况下,您想要进行独立的样本T检验。这意味着您要比较两个独立数据集的均值。

Excel具有TTEST功能,这就是您所需要的。

对于您的示例,您应该使用两个尾巴并输入2。

该公式将输出一个称为alpha误差概率的概率值。如果您假设两个数据集不同但这些数据集不同,则会出现此错误。 alpha错误概率越低,你的集合的机会就越大。

如果值低于0.01(1%),或者对于甚至0.001或更低的关键结果,您应该只接受两个数据集的差异。您还应该知道,在t检验中,每个数据集至少需要大约30个值才足够可靠,并且类型2测试假定两个数据集的方差相等。如果未给出相等的方差,则应使用类型3测试。

http://depts.alverno.edu/nsmt/stats.htm