在使用dplyr
管道时,我想使用mutate
将函数传递给NSE
,函数名称从向量传递。
给出两个函数名的向量:
funs <- c("sum", "mean")
我想用第一个值来获得总和:
require(dplyr)
mtcars %>%
group_by(cyl) %>%
mutate_(res = funs[1](hp))
这会导致错误:
Error in as.lazy_dots(list(...)) : attempt to apply non-function
do.call
do.call
的解决方案似乎会为总和产生一些结果:
mtcars %>%
group_by(cyl) %>%
mutate_(res = do.call(funs[1], .))
但尝试使用mean
时失败了:
>> mtcars %>%
+ group_by(cyl) %>%
+ mutate_(res = do.call(funs[2], .))
Error in mean.default(mpg = c(21, 21, 22.8, 21.4, 18.7, 18.1, 14.3, 24.4, :
argument "x" is missing, with no default
我猜测它在这里的应用方式毫无意义。因此,我的问题是:如何在dplyr
中使用nse,以便函数可以作为字符串从向量传递?
答案 0 :(得分:3)
我们可以使用get
和get
提取单个字符串的值。这里,它是一个函数,因此它返回函数本身。
mtcars %>%
group_by(cyl) %>%
mutate(res= get(funs[1])(hp))
用于传递其他参数
mtcars$hp[1] <- NA
mtcars %>%
group_by(cyl) %>%
mutate(res= get(funs[1])(hp, na.rm = TRUE))
答案 1 :(得分:2)
这些都使用mutate
而不是mutate_
mtcars %>%
group_by(cyl) %>%
mutate(res = do.call(funs[2], list(hp)))
mtcars %>%
group_by(cyl) %>%
mutate(res = match.fun(funs[2])(hp))
另请注意,如果我们使用[[2]]代替[2],那么这些将适用于问题中出现的字符向量funs
以及funs <- c(sum, mean)
。