在其他数据框列之间添加新列

时间:2013-04-11 19:13:23

标签: r dataframe

我想在我的数据框中添加一个带有“NA”的新列:

     A       B
1    14379  32094
2   151884  174367
3   438422  449382

但我需要它位于col之间。 A和B,像这样:

     A       C      B
1    14379   NA    32094
2   151884   NA    174367
3   438422   NA    449382

我知道如何添加col。 col后的C. B,但这对我没有帮助......任何人都知道怎么做?

4 个答案:

答案 0 :(得分:25)

通过两个步骤,您可以对列进行重新排序:

dat$C <- NA
dat <- dat[, c("A", "C", "B")]
         A  C          B
1  0.596068 NA -0.7783724
2 -1.464656 NA -0.8425972

您也可以使用append

dat <- data.frame(A = rnorm(2), B = rnorm(2))
as.data.frame(append(dat, list(C = NA), after = 1))

           A   C          B
1 -0.7046408  NA  0.2117638
2  0.8402680  NA -2.0109721

答案 1 :(得分:5)

如果您使用data.table,则可以使用setcolorder功能。请注意,NA存储为逻辑变量,如果要将列作为整数,双列或字符列启动,则可以使用NA_integerNA_real_NA_character_

例如

library(data.table)
DT <- data.table(DF)
# add column `C`  = NA 

DT[, C := NA]

setcolorder(DT, c('A','C','B'))
DT
##         A  C      B
## 1:  14379 NA  32094
## 2: 151884 NA 174367
## 3: 438422 NA 449382

您可以在一行中执行此操作

setcolorder(DT[, C: = NA], c('A','B','C'))

答案 2 :(得分:2)

您还可以使用包tibble,它具有非常有趣的功能(以及许多其他功能):add_column()

library(tibble)
df <- data.frame("a" = 1:5, "b" = 6:10)
add_column(df, c = rep(NA, nrow(df)), .after = 1)

该功能易于使用,您可以使用参数.before。

答案 3 :(得分:1)

我写了一个函数来将列附加到(into)data.frame。它允许您为列命名,并进行一些检查......

append_col <- function(x, cols, after=length(x)) {
    x <- as.data.frame(x)
    if (is.character(after)) {
        ind <- which(colnames(x) == after)
        if (any(is.null(ind))) stop(after, "not found in colnames(x)\n")
    } else if (is.numeric(after)) {
        ind <- after
    }
    stopifnot(all(ind <= ncol(x)))
    cbind(x, cols)[, append(1:ncol(x), ncol(x) + 1:length(cols), after=ind)]
}

的示例:

# create data
df <- data.frame("a"=1:5, "b"=6:10)

# append column 
append_col(df, list(c=1:5))

# append after an column index
append_col(df, list(c=1:5), after=1)

# or after a named column
append_col(df, list(c=1:5), after="a")

# multiple columns / single values work as expected
append_col(df, list(c=NA, d=4:8), after=1)

(在函数和索引结束时调用cbind的一个优点是data.frame中的字符不会被强制转换为使用as.data.frame(append(x, cols, after=ind))时的情况。