Question

我有以下时间序列，显示2017年全年15分钟的用电负荷：

-Datum & Zeit`        kWh            
Sun Jan-01-2017 01:45  374.420
Sun Jan-01-2017 02:00  355.040
Sun Jan-01-2017 02:15  359.995
Sun Jan-01-2017 02:30  375.715
Sun Jan-01-2017 02:45  371.520
Sun Jan-01-2017 03:00  355.100
Sun Jan-01-2017 03:15  411.780
Sun Jan-01-2017 03:30  417.330
Sun Jan-01-2017 03:45  401.555
Sun Jan-01-2017 04:00  362.180
Sun Jan-01-2017 04:15  361.605
Sun Jan-01-2017 04:30  366.155
Sun Jan-01-2017 04:45  363.785
....
...
Sun Dec-31-2017 23:45  363.785

我现在想将其转换为矩阵，该矩阵仅选择特定工作日（此处为星期天）的时间戳并将其转换为列，以便我可以比较一年中特定日期的负载，这样就可以结束最多52列。

  Sun Jan-01-2017    Sun Jan-08-2017   ....  Sun Dec-31-2017 23:45   
01:45  374.420            ...                ....
02:00  355.040            ...                ....
02:15  359.995            ...                ....
02:30  375.715            ...                ....
02:45  371.520            ...                ....
03:00  355.100            ...                ....
03:15  411.780            ...                ....
03:30  417.330            ...                ....
03:45  401.555            ...                ....
04:00  362.180            ...                ....
04:15  361.605            ...                ....
04:30  366.155            ...                ....
04:45  363.785            ...                ....
05:00  335.880            ...                ....

我该怎么办？

Answer 1

这不是可复制的示例，但是在将数据集格式化为时间序列对象之前我会做些什么，我将使用lubridate的wday（）函数创建一列，然后使用filter（）设置子集喜欢排除。另外，您还需要确保POSIXct中也有日期时间变量。

df <- mutate(df, wday= wday(TimeVar))
df.bizdays <- filter(df, wdat!= 1 & wday!=7)

然后，我将仅从该子集重新创建时间序列对象。这也会使您的季节性变得更加复杂，因此我也将考虑使用msts（）对象而不是ts（），尤其是如果您想在低于小时的时间进行分析。

希望有帮助！

Answer 2

这样的tidyverse解决方案怎么样：

library(tidyverse)

long_data <- data.frame(Datum_and_Zeit = c("Sun Jan-01-2017 01:45", "Sun Jan-01-2017 02:00", "Sun Jan-01-2017 02:15", "Mon Jan-02-2017 01:45", "Mon Jan-02-2017 02:00", "Mon Jan-02-2017 02:15"), kWh = c(374.420, 355.040, 359.995, 375.715, 371.520, 355.100), stringsAsFactors = FALSE)

我正在使用一小部分看起来像您的数据来说明。

wide_data <- long_data %>% 
separate(Datum_and_Zeit, into = c("Day", "Date", "Time"), sep = " ") %>% 
filter(Day == "Sun") %>% 
spread(Date, kWh) %>% 
select(-Day)

Answer 3

我不得不采取一些不同的方法。

以某种方式使用@david方法。出现“错误：var必须计算为单个数字或列名，而不是列表”

此外，它还提供了以下输出（2x53）

 Sun Jan-01-2017 01:45", "Sun Jan-01-2017 02:00", "Sun Jan-01-2017 02:15", ...
 SUN    74.420,             355.040,                359.995,               ....

我创建了另一个数据框，在其中划分了工作日，时间，日期和千瓦时

 Weekday   Time     Date         kWh
 Sun       01:45    Jan-01-2017  74.420
 Sun       02:45    Jan-01-2017  355.040
 ....
 ..


dailys<- data.frame(Time,Weekday,Date,Load)
dailys

wide_data <- dailys %>% 
   filter(Weekday == "sun") %>% 
   spread(Time, kWh) %>% 
   select(-Date)

在这里我得到以下输出，非常接近。

Weekday   Jan-01-2017   Jan-08-2017  Jan-015-2017 
Sun         4.420,        455.040,     789.995,
Sun          ...          ...         ...
Sun          ...          ...          ..
Sun
..
..

现在我将Weekday_Column替换为timestamps列（0:00; 00:15，00:30，...，23:45），这可能不是最平滑的方法吗？

R-根据工作日将时间序列拆分为多个列

3 个答案: