数据框所有行的平均列值

时间:2011-03-20 02:35:04

标签: r dataframe aggregate

我有一个数据框,我从这样的文件中读取:

name, points, wins, losses, margin
joe, 1, 1, 0, 1
bill, 2, 3, 0, 4
joe, 5, 2, 5, -2
cindy, 10, 2, 3, -2.5

我想在这些数据的所有行中平均列值,是否有一种简单的方法在R中执行此操作?

例如,我想获得所有“Joe's”的平均列值,以及

之类的内容
joe, 3, 1.5, 2.5, -.5

5 个答案:

答案 0 :(得分:13)

加载数据后:

df <- structure(list(name = structure(c(3L, 1L, 3L, 2L), .Label = c("bill", "cindy", "joe"), class = "factor"), points = c(1L, 2L, 5L, 10L), wins = c(1L, 3L, 2L, 2L), losses = c(0L, 0L, 5L, 3L), margin = c(1, 4, -2, -2.5)), .Names = c("name", "points", "wins", "losses", "margin"), class = "data.frame", row.names = c(NA, -4L))

只需使用aggregate功能:

> aggregate(. ~ name, data = df, mean)
   name points wins losses margin
1  bill      2  3.0    0.0    4.0
2 cindy     10  2.0    3.0   -2.5
3   joe      3  1.5    2.5   -0.5

答案 1 :(得分:8)

强制性plyrreshape解决方案:

library(plyr)
ddply(df, "name", function(x) mean(x[-1]))


library(reshape)
cast(melt(df), name ~ ..., mean)

答案 2 :(得分:3)

一个data.table解决方案,用于简化语法和内存效率

library(data.table)
DT <- data.table(df)
DT[,lapply(.SD, mean), by = name]

答案 3 :(得分:1)

我还有另一种方式。 我在其他例子中展示了它。

如果我们将矩阵xt设为:

a b c d
A 1 2 3 4
A 5 6 7 8
A 9 10 11 12
A 13 14 15 16
B 17 18 19 20
B 21 22 23 24
B 25 26 27 28
B 29 30 31 32
C 33 34 35 36
C 37 38 39 40
C 41 42 43 44
C 45 46 47 48

可以通过几个步骤计算重复列的平均值:
1.使用聚合函数计算平均值 2.进行两项修改:聚合将 rownames 写为新(第一)列,因此您必须将其定义为rownames ...
3 ....并删除此列,方法是选择第2列:xa对象的列数。

xa=aggregate(xt,by=list(rownames(xt)),FUN=mean)
rownames(xa)=xa[,1]
xa=xa[,2:5]

之后我们得到:

a b c d
A 7 8 9 10
B 23 24 25 26
C 39 40 41 42

答案 4 :(得分:0)

您可以简单地使用capturedImagesList.addAll(_bloc.urlImageStream.value); 中的函数按名称对数据进行分组,然后按给定的函数(例如,均值)汇总所有剩余的列:

tidyverse