Question

我有两个长度相同的向量a和b。向量包含游戏的播放次数。因此，例如，在群组265350中玩a时，游戏1已在52516中播放b。

a <- c(265350, 89148, 243182, 208991, 113090, 124698, 146574, 33649, 276435, 9320, 58630, 20139, 26178, 7837, 6405, 399)
b <- c(52516, 42840, 60571, 58355, 46975, 47262, 58197, 42074, 50090, 27198, 45491, 43048, 44512, 27266, 43519, 28766)

我想用Pearsons Chi square test来测试两个向量之间的独立性。在R I中键入

chisq.test(a,b)

我得到一个p值0.2348意味着这两个向量是独立的（H是真的）。

但是当我运行pairwise.prop.test(a,b)并得到所有成对p值并且几乎所有它们都非常低时，意味着两个向量之间存在成对依赖关系，但这与第一个结果形成对比。怎么可能？

Answer 1

pairwise.prop.test不适合您的情况。

正如文档中提到的那样：

计算成对比例之间的成对比较，并进行多次测试校正

还有：

x （第一个参数）。
成功计数的矢量或带有2列的矩阵分别给出成功和失败的计数。

和

n （第二个参数）。
试验计数向量;如果x是矩阵，则忽略。

因此，x中n的成功次数是试验，即x <=（小于或等于）n中的每一对。这就是pairwise.prop.test用于比例的原因。举一个例子，想象一下投掷一枚硬币1000次，获得头部550. x将是550，n将是1000.在你的情况下，你没有类似的东西，你只有两组游戏的数量。

测试独立性的正确假设检验是您已经使用的chisq.test(a,b)，我相信这一点。

Pearson和Pairwise.prop.test之间的矛盾

1 个答案: