使用R创建表摘要

时间:2018-09-30 19:54:36

标签: r summary

我有一个包含2列的数据集,如图所示。我想做的是绘制一个表摘要,其中行作为组(1-5、6-10、11-15、16-20),列作为是和否的百分比。没有代码,因为我不知道如何开始。但是我有数据集。

Col 1   Col 2
 1       Yes
 2       No
 3       Yes
 4       No
 5       No
 6       No
 7       Yes
 8       Yes
 9       Yes
10       No
12       Yes
14       No
16       No
18       No
20       Yes

2 个答案:

答案 0 :(得分:1)

基本的R解决方案可能涉及cutaggregate

f <- cut(dat$Col.1, c(1, 6, 11, 16, 21, Inf),
         include.lowest = TRUE, right = FALSE)
agg <- aggregate(Col.2 ~ f, dat, table)
agg <- cbind(agg[1], agg[[2]])
agg[2:3] <- 100*agg[2:3]/rowSums(agg[2:3])

agg
#        f       No      Yes
#1   [1,6) 60.00000 40.00000
#2  [6,11) 40.00000 60.00000
#3 [11,16) 50.00000 50.00000
#4 [16,21) 66.66667 33.33333

数据。

dat <-
structure(list(Col.1 = c(1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 
10L, 12L, 14L, 16L, 18L, 20L), Col.2 = structure(c(2L, 1L, 2L, 
1L, 1L, 1L, 2L, 2L, 2L, 1L, 2L, 1L, 1L, 1L, 2L), .Label = c("No", 
"Yes"), class = "factor")), class = "data.frame", row.names = c(NA, 
-15L))

答案 1 :(得分:0)

1):仅使用底注R中的底数R和DF

nr <- nrow(DF)
group <- 5 * ceiling(DF$Col1 / 5)
100 * prop.table(xtabs(~ group + Col2, DF), 1)

给予:

     Col2
group       No      Yes
   5  60.00000 40.00000
   10 40.00000 60.00000
   15 50.00000 50.00000
   20 66.66667 33.33333

2)或使用更高级的组标签,请尝试使用比其他方法更好的标签:

nr <- nrow(DF)

g <- 5 * ceiling(DF$Col1 / 5) # from above
labels <- unique(paste0(g-4, "-", g))
group <- factor(g, labels = labels)

tab <- 100 * prop.table(xtabs(~ group + Col2, DF), 1)

给予:

> tab
       Col2
group         No      Yes
  1-5   60.00000 40.00000
  6-10  40.00000 60.00000
  11-15 50.00000 50.00000
  16-20 66.66667 33.33333

> # another layout
> ftable(tab, row.vars = 1:2)

group Col2          
1-5   No    60.00000
      Yes   40.00000
6-10  No    40.00000
      Yes   60.00000
11-15 No    50.00000
      Yes   50.00000
16-20 No    66.66667
      Yes   33.33333

> plot(tab, col = c("pink", "lightgreen"))

screenshot

注意

可重复形式的输入DF为:

Lines <- "Col1   Col2
 1       Yes
 2       No
 3       Yes
 4       No
 5       No
 6       No
 7       Yes
 8       Yes
 9       Yes
10       No
12       Yes
14       No
16       No
18       No
20       Yes"
DF <- read.table(text = Lines, header = TRUE)

更新

修订几次。