如何在R中重构数据帧?

时间:2017-06-01 13:24:00

标签: r dataframe structure mean datamatrix

我有一个通过插入数值数组的函数生成的数据帧。 df由156个变量组成,每个变量有4261个观测值。我试图找到每列的平均值,但colMeans()函数会出现以下错误:

> colMeans(results)
Error in if (inherits(X[[j]], "data.frame") && ncol(xj) > 1L) X[[j]] <- as.matrix(X[[j]]) : 
  missing value where TRUE/FALSE needed

我认为它与数据帧的结构有关,因此我试图改变它,但这又产生了另一个错误。

> str(results) 
'data.frame':   4261 obs. of  156 variables:
 $ r5.2.5     : num  0 0 0 0 0 0 0 0 0 0 ...
 $ r10.2.5    :'data.frame':    4261 obs. of  1 variable:
  ..$ ret: num  0 0 0 0 0 0 0 0 0 0 ...
 $ r20.2.5    :'data.frame':    4261 obs. of  1 variable:
  ..$ ret: num  0 0 0 0 0 0 0 0 0 0 ...
 $ r30.2.5    :'data.frame':    4261 obs. of  1 variable:
  ..$ ret: num  0 0 0 0 0 0 0 0 0 0 ...
....

> results <- as.data.frame(as.numeric(results))
Error in as.data.frame(as.numeric(results)) : 
  (list) object cannot be coerced to type 'double'
> results <- data.matrix(results)
Error in data.matrix(results) : 
  (list) object cannot be coerced to type 'double'

我认为我使用的其中一个功能是创建数据帧并将它们附加到现有的df上,因此“数据框架”和“在数组的结构中。

有没有办法可以将数据框重构为可以运行colMeans()和colSums()等函数的数据框?

1 个答案:

答案 0 :(得分:1)

看起来你的一些列本身就是数据框,你需要将它们变回向量,这就是你的工作方式

## get the columns in question 

my_dfs <- sapply(results, function(x) is.data.frame(x))

## turn them into vectors 

results[,my_dfs] <- sapply(results[,my_dfs], function(x) unlist(x))

### then you can do 

my_means <- sapply(results, mean)