将多个列添加到data.table的子集中:=

时间:2012-08-21 12:45:59

标签: r data.table

我的问题是对此前回答的问题的扩展:

Add multiple columns to R data.table in one function call?

如果data.table有一个根据I子集的键,我在分配多个新列时遇到问题。例如:

library(data.table)
example(data.table)
DT[J("a")]
   x y  v  m
1: a 1 42 42
2: a 3 42 42
3: a 6 42 42

即。 DT有key(DT) = c("x", "y"),我想在一次调用中分配2个新列new1new2,类似于上面的解决方案。我这样做:

DT[J("a"),c("new1","new2") := list(c(1,2,3),c(3,2,1)),with=FALSE]

但我明白了

   x y  v  m new1
1: a 1 42 42    1
2: a 3 42 42    2
3: a 6 42 42    3
4: b 1  4  5   NA
5: b 3  5  5   NA
6: b 6  6  5   NA
7: c 1  7  8   NA
8: c 3  8  8   NA
9: c 6  9  8   NA

即。行为符合预期(将值指定给x == a,NA else),但仅限于第一列。这是我的错误还是错误?

请注意,如果没有DT的子集,这可以完美地运行:

DT[,c("new1","new2") := list(c(1,2,3),c(3,2,1)),with=FALSE]
   x y  v  m new1 new2
1: a 1 42 42    1    3
2: a 3 42 42    2    2
3: a 6 42 42    3    1
4: b 1  4  5    1    3
5: b 3  5  5    2    2
6: b 6  6  5    3    1
7: c 1  7  8    1    3
8: c 3  8  8    2    2
9: c 6  9  8    3    1

1 个答案:

答案 0 :(得分:9)

很好地发现:这是一个新的错误。请提交bug.report(package="data.table")

感谢。

===

现已在v1.8.3中修复。 Bug#2215latest NEWS