如何通过两个变量总结关键统计数据?

时间:2019-05-10 22:03:08

标签: r

以下是一些示例代码:

dat = data.frame(income = c(100,200,300,400,500,600), 
                 sex = c("M","M","M", "F","F","F"), 
                 num.kid = c(1,2,3,1,2,3))

我想生成一个二维表,按性别和数字对收入分配的关键统计数据(例如均值和变量)进行汇总。

例如,table(dat$sex, dat$num.kid)会给我一个2x3的表,其中sex作为行,num.kid作为列,但是该表将填充这些组合的数量。如何将第三个变量(例如收入)带入表格?如何用incomesexnum.kid的均值或var填充表格?这几乎就像使用R代码填写Excel数据透视表一样。

1 个答案:

答案 0 :(得分:1)

以下是使用您的数据的示例:

library(dplyr)
dat %>% 
  group_by(sex) %>%  
  summarise(mean = mean(income), 
            var = var(income),
            sd = sd(income))

您可以在group_by语句中放置多个字段。