R中汇总的二维表

时间:2013-12-01 18:01:21

标签: r summarization

我们来看看这段代码:

library(doBy)
tab <- summaryBy(x ~ A + B, df)

它计算A&amp;的每个组合的x的平均值。乙

如何在tab中创建一个2D表格,其中A位于行中,B位于列中,因此行和列的交集会给出{{1}的平均值对于给出A&amp;组合的组乙

2 个答案:

答案 0 :(得分:3)

我会跳过中间步骤并使用一个旨在提供您想要的功能的功能,即tapply。使用agsudy的数据:

> x.mean <- with(dat, tapply(x, list(A=A,B=B), mean))
> x.mean
   B
A           2         3         4         5
  1 0.3671088 0.4531040 0.5942483 0.8013453
  2 0.4776386 0.6115361 0.7907584 0.6607741
  3 0.3966482 0.3447879 0.4372367 0.4914243
  4 0.2779789 0.6780573 0.4087858 0.4205421
  5 0.6288597 0.6924584 0.6508705 0.5648296

如果您真的想使用中间步骤,还可以使用tapplyIc函数进行重新排列:

with(tab, tapply(x.mean, list(A=A,B=B), c))
   B
A           2         3         4         5
  1 0.3671088 0.4531040 0.5942483 0.8013453
  2 0.4776386 0.6115361 0.7907584 0.6607741
  3 0.3966482 0.3447879 0.4372367 0.4914243
  4 0.2779789 0.6780573 0.4087858 0.4205421
  5 0.6288597 0.6924584 0.6508705 0.5648296

> with(tab, tapply(x.mean, list(A,B), I))
          2         3         4         5
1 0.3671088 0.4531040 0.5942483 0.8013453
2 0.4776386 0.6115361 0.7907584 0.6607741
3 0.3966482 0.3447879 0.4372367 0.4914243
4 0.2779789 0.6780573 0.4087858 0.4205421
5 0.6288597 0.6924584 0.6508705 0.5648296

答案 1 :(得分:1)

如果我理解,我认为您正在寻找重塑您的数据。一种选择是使用dcast包中的reshape2

dat.s <- summaryBy(x~B+A, data=dat)
library(reshape2)
dcast(dat.s,A~B)

例如:

## create some data 
set.seed(1)
dat <- data.frame(x=runif(100),
                  A=sample(1:5,100,rep=TRUE),
                  B=sample(2:5,100,rep=TRUE))


library(doBy)
dat.s <- summaryBy(x~B+A, data=dat)
dat.s <- round(dat.s,2)   ## for better output
library(reshape2)
dcast(dat.s,A~B)

  A    2    3    4    5
1 1 0.37 0.45 0.59 0.80
2 2 0.48 0.61 0.79 0.66
3 3 0.40 0.34 0.44 0.49
4 4 0.28 0.68 0.41 0.42
5 5 0.63 0.69 0.65 0.56