我该如何计算这些统计数据?

时间:2008-08-04 22:56:46

标签: statistics spss

我正在编写一个应用程序来帮助促进一些研究,其中一部分涉及进行一些统计计算。目前,研究人员正在使用一个名为SPSS的程序。他们关心的部分输出如下:

[Part of the SPSS output

他们真的只关心FSig.值。我的问题是我没有统计学的背景,我无法弄清楚测试的内容,或者如何计算它们。

我认为F值可能是F-test的结果,但在按照维基百科上给出的步骤后,我得到的结果与SPSS给出的结果不同。 / p>

6 个答案:

答案 0 :(得分:3)

我从您的问题中假设您的研究同事希望自动化执行某些统计分析的过程(即,他们希望批量处理数据集)。您有两种选择:

1)SPSS现在可以通过python编写脚本(从版本15开始) - 转到spss.com并搜索python。您可以编写python脚本来自动化数据分析并从数据透视表中提取键值,然后以您喜欢的方式处理答案。这样做的好处是可以精确比较python脚本的结果和协作者SPSS中的手工计算工作。因此,您不必真正了解任何统计数据来完成这项工作(这是一个关键优势)

2)你可以在R这个免费的统计环境中做到这一点,这可能是脚本化的。这样做的缺点是您必须学习统计信息以确保正确执行此操作。

答案 1 :(得分:3)

This website可能会帮助你多一点。还this one

我正在从统计课程的相当生疏的记忆中工作,但这里什么都没有:

当您进行方差分析(ANOVA)时,实际上将F统计量计算为“组间”的均方差异与“组内均方差异”的比率。上面的第二个链接似乎非常适合这种计算。

这使得F统计量确切地测量了模型的强大程度,因为“组间”方差是解释力,“组内”方差是随机误差。高F意味着一个非常重要的模型。

与许多统计操作一样,您回溯确定Sig。使用F统计量。这里是您的维基百科信息有点方便的地方。你想要做的是 - 使用SPSS给你的自由度 - 找到F table给你你计算的F统计量的正确P值。发生这种情况的P值[F(表)= F(计算)]是重要性。

从概念上讲,较低的显着性值显示出非常强的拒绝零假设的能力(出于这些目的,这意味着确定您的模型具有解释力)。

如果有任何错误的话,对任何数学家都很抱歉。我会回来查看编辑!!!

祝你好运。统计很有趣,也许不是这部分。 =)

答案 2 :(得分:2)

统计很难:-)。经过一年的阅读和重新阅读书籍和论文,只能自信地说我理解它的基础知识。

您可能希望调查现成的库,无论您使用哪种编程语言,因为它们在数学方面有很多问题,特别是统计数据(舍入错误就是一个明显的例子)。

作为一个例子,你可以看看the R project,它既是一个交互式环境,也是一个可以在你的C ++代码中使用的库,它是在GPL下发布的(即如果你只在内部使用它,只发布结果,您不需要打开代码。)

答案 3 :(得分:2)

简而言之:不要手动执行此操作,链接/使用现有软件。并且sain_grocen的回答是不正确的。 :(

这些都是参数估计重要性的所有测试,通常用于多变量响应多元回归。在统计编程环境之外,这些不是简单的事情。我建议要么从预先存在的统计程序中获取输出,要么使用可以链接到的程序并使用该代码。

我担心第一个答案(sain_grocen)会引导你走错路。他的解释很可能是你实际处理的一个特例。 anova在他的链接中解释了在平衡设计中的单一变量响应。这些不是您看到的F统计数据。输出中的名称(Pillai's Trace,Hotelling's Trace,...)是一些可用的多变量版本。他们在某些假设下有F分布。我无法在这里解释一本有价值的教科书,我建议你先看看 Johnson和Wichern的“应用多元统计分析”

答案 4 :(得分:0)

你能解释一下为什么SPSS本身不是解决这个问题的好方法吗?它是否会生成数据透视表作为难以操作的输出?这是该计划的成本吗?

F统计数据可能来自任何数量的特定测试。 F只是一个分布(松散地:对值组的“频率”的描述),如正态(高斯)或统一。一般来说,它们来自方差比。意见:许多统计学家(包括我自己)发现基于F的测试不稳定(行话:非健壮)。

特定的输出统计数据(Pillai的跟踪等)表明原始分析是一个MANOVA示例,正如其他海报描述的那样,这是一个复杂且难以正确的过程。

我猜也是,基于MANOVA,以及SPSS的使用,这是一个心理学或社会学项目......如果不是请指教。可能其他更简单的模型实际上可能更容易理解,更可重复。如果您有,请咨询您当地的大学统计咨询小组。

祝你好运!

答案 5 :(得分:0)

以下是MANOVA ouptput的解释,来自一个非常好的统计网站和SPSS:

输出说明: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

如何以及为何选择MANOVA或多元GLM: (与上述路径相同,但终止于'/manova.htm')

从头开始编写软件来计算这些输出既费时又困难; 有很多数值问题和矩阵求逆。

正如亨利所说,使用Python脚本或者R.我建议与知道SPSS的人一起工作。 此外,SPSS本身能够使用称为OMS的输出将输出表导出到文件。 SPSS中的脚本可以执行此操作。

了解您的研究小组中的哪些人了解SPSS并与他们合作。