填写缺少的时间序列数据

时间:2019-03-05 04:35:31

标签: r time-series tidyr

我目前有一个停车数据的数据框,由大约700,000行和5列组成。如下面的链接所示。

Dataframe

每当泊车状态发生变化时(即某个地点从parking_present变为Parking_empty或相反),数据库都会记录数据。我想填写数据集,以便在没有更改的情况下用数据填充它。数据集每两分钟更新一次,因此我也希望对其进行更新。

到目前为止,我已经编写了以下代码以尝试对其进行填写。

   new <- dataset %>%
          mutate(timezoned_event_timestamp = as.POSIXct(timezoned_event_timestamp))
          complete(timezoned_event_timestamp = seq(floor_date(min(new$timezoned_event_timestamp), "day"), max(new$timezoned_event_timestamp), 1)) %>%
          fill(c(parking_bay_string_id, latitude, longitude, type), .direction = "up")

我的问题是,它似乎没有为每个parking_bay_string_id创建新行。我使用了一个count函数,其中一些具有很多值(260,000),而另一些则只有1。

如何解决我的代码,使每个不同的parking_bay_string_id具有相等的行数,以反映每两分钟更新一次的数据?

0 个答案:

没有答案