使用统计数据计算标准偏差

时间:2014-05-27 22:31:26

标签: gnuplot

我有以下数据集,

1.54    23.66
1.75    26.25
1.92    30.20
2.08    34.46
2.44    42.08
2.78    46.81
3.03    51.10
3.70    52.99
4.17    56.15
4.76    59.34

计算标准偏差 (SD)前两点,我用,

stats "data.dat" u 2 every ::0::1

但是,这给了我错误 SD = 1.2950(正确为1.83)

* FILE: 
  Records:      2
  Out of range: 0
  Invalid:      0
  Blank:        0
  Data Blocks:  1

* COLUMN: 
  Mean:         24.9550
  Std Dev:       1.2950
  Sum:          49.9100
  Sum Sq.:    1248.8581

  Minimum:      23.6600 [0]
  Maximum:      26.2500 [1]
  Quartile:     23.6600 
  Median:       24.9550 
  Quartile:     26.2500 0

那么我做错了什么? TIA。

1 个答案:

答案 0 :(得分:2)

当标准偏差按1.83标准化时,获得您提及的sqrt(N-1)的值,其中N是样本大小。这样做是为了防止估计中的偏差。也就是说,使用来自总体的随机抽取样本计算标准偏差,使其预期值等于真实值。

Gnuplot stats将提供的数据集视为总体,因此按sqrt(N)进行标准化。因此1.29的值也是正确的,您也可以将值从一个转换为另一个。

例如:将1.29转换为1.83乘以sqrt(N/N-1)

有关更完整的讨论,请点击此维基百科链接:

Unbiased estimation of Standard Deviation