在R data.table中 - 按组按日期​​标记/更改列

时间:2014-05-19 00:07:49

标签: r data.table

我正在尝试使用data.table标记每个ID的最大和最小观察日期。虽然我认为这是一个直接的练习,但我真的不明白为什么我没有得到我希望的结果:由于某种原因,以下data.table命令只标记整体最小值和最大值而不是" per ID",即使这表明:

可重复示例(按ID标记最大值):

library(data.table)

date1 = as.POSIXct(Sys.Date(), "%m-%d-%Y-%X")
date2 = date1 - 70000
date3 = date1 - 7000
date4 = date1 + 90000

DT = data.table(ID= rep(1:2,each = 3), Date=c(date1,date2,date3,date4,date1,date2))

# create position marker (2 means middle value for date - not min/not max)
DT[,Position:=2]

# change position marker to 3 if latest date
DT[Date==max(Date),Position:=3, by=ID]

为什么data.table不考虑" by = ID"部分?我在俯瞰什么?

版本: Data.table 1.9.2 R:3.0.3

1 个答案:

答案 0 :(得分:2)

我相信它正在过滤数据,然后是by语句。也许你想要的是:

DT[, Position := ifelse(Date==max(Date),3,2), by= ID]