Question

我是R和编写函数的新手。我花了数小时试图找出答案并搜索Google，但似乎找不到任何东西。希望您能提供帮助？我想使用ts（）函数使用lapply（）分析以下数据。

我的代码如下：

library(dplyr)

#group out different sites
 mylist <- data %>%
   group_by(Site)
 mylist

#Write ts() function
 alpha_function = function(x) {
    ts_alpha = ts(x$Temperature, frequency=12, start=c(0017, 7, 20))
     return(data.frame(ts_alpha))    
 }

 #Run list through lapply()
 results = lapply(mylist, alpha_function())

但是我得到这个错误：参数“ x”缺失，没有默认值。

我有一个看起来像这样的数据集：

Site(factor)    Date(POSIXct)         Temperature(num)
1               0017-03-04            2.73
2               0017-03-04            3.73
3               0017-03-04            2.71
4               0017-03-04            2.22
5               0017-03-04            2.89
etc.

我在5个不同地点的不同日期都有3,000多个温度读数。

谢谢！

Answer 1

我不是一个完全R的人，但是我敢打赌： results = lapply(mylist, alpha_function()) 应该 results = lapply(mylist, alpha_function)。

当您尝试将Alpha函数提供给lapply时，您拥有的调用功能是什么，当您真正（最有可能）想要做的就是提供对该函数的引用时，叫它。（您收到的错误表明alpha_function在像alpha_function()一样被调用时需要x参数）。

Answer 2

与dplyr和tidyverse一起使用时，建议的方法是将内容保留在数据帧中：

library(tidyverse)
library(zoo)

dat %>% 
  nest(-Site) %>% 
  mutate(data = map(data, ~ zoo(.x$Temperature, .x$Date)))

# # A tibble: 5 x 2
#   Site  data     
#   <fct> <list>   
# 1 a     <S3: zoo>
# 2 b     <S3: zoo>
# 3 c     <S3: zoo>
# 4 d     <S3: zoo>
# 5 e     <S3: zoo>

或者如果我们必须有ts而不是zoo个对象，则可以使用as.ts(zoo(...))。

如果我们仍然希望使用常规列表，则可以使用基数split()和lapply()：

dat %>% 
  split(.$Site) %>% 
  lapply(function(.x) zoo(.x$Temperature, .x$Date))

# List of 5
#  $ a:‘zoo’ series from 2017-03-04 12:00:00 to 2017-05-06 00:30:00
#   Data: num [1:3000] 5.37 5.49 5.32 5.44 5.43 ...
#   Index:  POSIXct[1:3000], format: "2017-03-04 12:00:00" ...
#  $ b:‘zoo’ series from 2017-03-04 12:00:00 to 2017-05-06 00:30:00
#   Data: num [1:3000] 5.36 5.22 5.15 5.41 5.41 ...
#   Index:  POSIXct[1:3000], format: "2017-03-04 12:00:00" ...
#  $ c:‘zoo’ series from 2017-03-04 12:00:00 to 2017-05-06 00:30:00
#   Data: num [1:3000] 6.08 6.11 6.22 6.13 6.03 ...
#   Index:  POSIXct[1:3000], format: "2017-03-04 12:00:00" ...
#  $ d:‘zoo’ series from 2017-03-04 12:00:00 to 2017-05-06 00:30:00
#   Data: num [1:3000] 5.06 4.96 5.23 5.16 5.29 ...
#   Index:  POSIXct[1:3000], format: "2017-03-04 12:00:00" ...
#  $ e:‘zoo’ series from 2017-03-04 12:00:00 to 2017-05-06 00:30:00
#   Data: num [1:3000] 5.1 5.08 5.14 5.13 5.22 ...
#   Index:  POSIXct[1:3000], format: "2017-03-04 12:00:00" ...

（其中dat的生成如下：

n_sites <- 5
n_dates <- 3000

set.seed(123) ; dat <- tibble(
  Site = factor(rep(letters[1:n_sites], each = n_dates)), 
  Date = rep(seq.POSIXt(as.POSIXct("2017-03-04 12:00:00"), by = "30 min", length.out = n_dates), times = n_sites),
  Temperature = as.vector(replicate(n_sites, runif(1, 5, 6) + cumsum(rnorm(n_dates, 0, 0.1))))
)

使用lapply标准化ts（）函数

2 个答案: