程序员的统计工具

时间:2008-10-09 21:13:53

标签: math statistics

我正在尝试评估购买统计工具。这将部分由非编程用户(进行临床研究)和部分程序员使用,因此我试图在可用性和自动化之间找到一个很好的折衷方案。当然,成本是一个问题,但如果我能够建立一个坚实的案例,我们可能会购买商业套餐,所以我们并不完全限于免费选择。

到目前为止,我们的选择是:

  • Statistica(一些非程序员已经知道)
  • Matlab统计工具箱(程序员已经使用matlab)
  • R语言(非程序员需要UI)
  • 将某些内容刻录到Excel中(不好玩,但这就是非程序员现在所做的事情)
  • ?...

还有什么?什么是行业标准?我应该寻找什么样的特色?你会推荐什么,为什么?

理想情况下,我们想要一个可以在Linux和Windows机器上运行的工具。

(我从事医学成像工作,因此我们同时进行生物统计学和软件工程统计)

11 个答案:

答案 0 :(得分:5)

放下它R。 R对程序员非常友好。它有功能方面,它是GNU。

S-PLUS和R都基于S语言。两者都相似,在大多数情况下,您可以在R中作为S-PLUS程序运行,反之亦然。

SAS是另一种选择,但更倾向于BI和企业。 SAS的语法比R简单,在我看来,非程序员更容易获取。

其他选项包括SPSS,Matlab甚至Excel。

答案 1 :(得分:3)

我个人推荐R.我听说它被生物信息学家和心理学家使用。不知道你的领域是什么,所以也许这是一个糟糕的选择。它相当容易使用和学习。

答案 2 :(得分:2)

StataSPSS往往是临床研究中最常用的包。两者都非常容易被提取和用于非技术头脑的人,但通常足够灵活。我比其他任何人都更多地使用Stata并且对它的选项非常满意(支持基于菜单和命令行操作,足够好的插件系统来获得新的用户创建的模块,良好的图形支持)。

R对新手用户来说有点令人生畏,尽管它很受生物统计学家的欢迎。由于它是免费的,这是另一个有利的点。

答案 3 :(得分:2)

对于具有非技术用户可以使用的GUI的统计软件包,我建议您使用“SAS Enterprise Guide”。您将获得通用和高级SAS程序,出色的图形工具以及为技术用户编程的能力。我建议您从“SAS学习版”(http://support.sas.com/learn/le/)开始,它是Enterprise Guide的全功能版本,但仅限于一次处理1000行。它低于500美元,这是一个非常好的交易。

答案 4 :(得分:1)

我会看S-Plus

您将获得强大的编程环境(基于Eclipse平台的S-Plus Workbench),非程序员的直观GUI以及广泛的用户社区(包括基于原始S的R用户)。

答案 5 :(得分:1)

Visual Numerics是另一种选择。

答案 6 :(得分:1)

听起来你正试图最大化多个目标。你说“这将部分由非编程用户使用(进行临床研究),部分由程序员使用,所以我试图在可用性和自动化之间找到一个很好的折衷方案”,隐含的假设是这将是两种情况下的相同的工具,当这可能不太现实时。例如,Word和LaTeX的妥协是什么?

有关要求的一些不同问题:

  • 它应该是程序员可扩展的吗?
    • 能够使用C扩展
    • 轻松制作新程序和方法
  • 非程序员想要使用哪些分析?
  • 图形?
  • 不同群体的易用性

所以我读到了这个:

易于扩展:R / S-plus,Matlab / Octave(我碰巧更喜欢R,但我做了更多的统计数据和更少的矩阵事物) 易于普通人使用:Excel,自定义包装R,SPSS

此外,Windows上的R具有有限的GUI,这可能会或可能不会帮助您的用户。

如果是我,我会选择混合解决方案。使用R,并为非程序员提供一个用于常见任务的备忘单,以说明常见任务,甚至更好,编写一些名称如“image_summary”的包装函数,以自动化他们的探索性工作。

为了编写R的前端脚本,RPy python包装器也可以提供帮助。

答案 7 :(得分:1)

SAS Enterprise Guide对非程序员具有良好的可用性。此外,它有很好的连接到Excel的选项。而对于程序员来说,它是最强大的选择。 sas服务器可以运行任何东西,但企业指南只适用于Windows。

答案 8 :(得分:0)

再考虑一次Excel。它是众所周知的,并且广泛可用。请参阅此book或此book

答案 9 :(得分:0)

这个Wikipedia page比较了几个统计软件包的可用功能,以及它们的操作系统兼容性和定价信息(这看起来有些过时,但它提供了一个总体概念)

答案 10 :(得分:0)

我们最终获得了Matlab Statistics工具箱(主要是因为我们已经在团队中拥有Matlab的一些经验,并且无论如何都需要该工具)

到目前为止,它正在做我们需要做的事情,并且它很容易扩展。用法将显示非程序员是否真的使用它,但到目前为止看起来很好。