如何为连续和非连续的日期创建索引

时间:2015-10-26 16:57:24

标签: r dataframe

我有一个大型的data.frame结构为:

date    torn_count  torn_dpi
31-12-2014  1   0.001
28-12-2014  3   0.003
27-12-2014  1   0.001
22-12-2014  1   0.001
21-12-2014  1   0.001
20-12-2014  1   0.001
19-12-2014  1   0.001
18-12-2014  1   0.001
17-12-2014  3   0.003
15-12-2014  2   0.002
14-12-2014  1   0.001
13-12-2014  1   0.002
11-12-2014  5   0.104
10-12-2014  3   0.003
09-12-2014  1   0.001
08-12-2014  5   0.104
01-12-2014  5   0.014
30-11-2014  2   0.002
29-11-2014  1   0.001
26-11-2014  1   0.001
25-11-2014  2   0.045
24-11-2014  2   1.83

我正在尝试添加一个连续几天具有相同值且在非连续日期内增加的索引。类似的东西:

date    torn_count  torn_dpi    index
31/12/2014  1   0.001   1
28/12/2014  3   0.003   2
27/12/2014  1   0.001   2
22/12/2014  1   0.001   3
21/12/2014  1   0.001   3
20/12/2014  1   0.001   3
19/12/2014  1   0.001   3
18/12/2014  1   0.001   3
17/12/2014  3   0.003   3
15/12/2014  2   0.002   4
14/12/2014  1   0.001   4
13/12/2014  1   0.002   4 

对于上述问题的任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:4)

我们可以使用iMacros。我们将'data.frame'转换为'data.table'(data.table),将'date'转换为setDT(df1)类,获取相邻元素之间的差异,检查它是否不等于1 ,并执行Date以创建“索引”列。

cumsum