Pearson和Pairwise.prop.test之间的矛盾

时间:2015-11-11 10:05:26

标签: r statistics

我有两个长度相同的向量ab。向量包含游戏的播放次数。因此,例如,在群组265350中玩a时,游戏1已在52516中播放b

a <- c(265350, 89148, 243182, 208991, 113090, 124698, 146574, 33649, 276435, 9320, 58630, 20139, 26178, 7837, 6405, 399)
b <- c(52516, 42840, 60571, 58355, 46975, 47262, 58197, 42074, 50090, 27198, 45491, 43048, 44512, 27266, 43519, 28766)

我想用Pearsons Chi square test来测试两个向量之间的独立性。在R I中键入

chisq.test(a,b)

我得到一个p值0.2348意味着这两个向量是独立的(H是真的)。​​

但是当我运行pairwise.prop.test(a,b)并得到所有成对p值并且几乎所有它们都非常低时,意味着两个向量之间存在成对依赖关系,但这与第一个结果形成对比。怎么可能 ?

1 个答案:

答案 0 :(得分:1)

pairwise.prop.test不适合您的情况。

正如文档中提到的那样:

  

计算成对比例之间的成对比较,并进行多次测试校正

还有:

  

x (第一个参数)。
  成功计数的矢量或带有2列的矩阵分别给出成功和失败的计数。

  

n (第二个参数)。
  试验计数向量;如果x是矩阵,则忽略。

因此,xn的成功次数是试验,即x <=(小于或等于)n中的每一对。这就是pairwise.prop.test用于比例的原因。举一个例子,想象一下投掷一枚硬币1000次,获得头部550. x将是550,n将是1000.在你的情况下,你没有类似的东西,你只有两组游戏的数量。

测试独立性的正确假设检验是您已经使用的chisq.test(a,b),我相信这一点。