将两组列名传递给函数

时间:2019-06-14 20:22:51

标签: r dplyr tidyeval

我试图传递两组列名称以起作用,并使用dplyr对它们进行处理。通常对于一组,我将使用省略号(...)并通过enquos()将其转换为quosures。但是现在我有两组列名,因此我考虑使用列表来存储它们。我应该如何以最有效的方式进行这项工作? (最欢迎使用purrr,rlang和任何其他软件包的功能的答案)

数据包和示例

library(dplyr) #I use whole library(tidyverse) but this is sufficient for this case

some.data <- tibble(col1 = sample(letters[1:3], 500, replace = T),
                    col2 = sample(letters[1:3], 500, replace = T),
                    col3 = sample(letters[4:6], 500, replace = T),
                    col4 = sample(letters[4:6], 500, replace = T))

我的函数(简单地说)如下:

cross_table <- function(data = NULL, list1 = NULL, list2 = NULL){

   for(l1 in list1){
      for(l2 in list2){

         data.out <- data %>% 
            count(l1, l2) %>% 
            spread(l2, n, fill = 0, drop = FALSE)

         print(data.out) #Just to show it works. I want to use 'data.out' object later on

      }
   }
}

我想使用这样的函数(不将列的名称作为字符串)

some.data %>%
   cross_table(list1 = list(col1, col2), list2 = list(col3, col4))

1 个答案:

答案 0 :(得分:3)

vars()函数在这里很合适。您可以在函数参数中使用它代替list()。我看到了一个示例in this SO answer,它很容易扩展到您的情况。

加上循环中的一些tidyeval如下所示:

cross_table <- function(data = NULL, list1 = NULL, list2 = NULL){

        for(l1 in list1){
            for(l2 in list2){

                l1 = enquo(l1)
                l2 = enquo(l2)
                data.out <- data %>%
                    count(!!l1, !!l2) %>%
                    spread(!!l2, n, fill = 0, drop = FALSE) 

                print(data.out) 
            }
        }
    }

some.data %>%
   cross_table(list1 = vars(col1, col2), list2 = vars(col3, col4))


# A tibble: 3 x 4
  col1      d     e     f
  <chr> <dbl> <dbl> <dbl>
1 a        58    61    53
2 b        38    59    47
3 c        65    59    60
# A tibble: 3 x 4
  col1      d     e     f
  <chr> <dbl> <dbl> <dbl>
1 a        53    61    58
2 b        44    47    53
3 c        56    62    66
# A tibble: 3 x 4
  col2      d     e     f
  <chr> <dbl> <dbl> <dbl>
1 a        55    60    51
2 b        57    67    56
3 c        49    52    53
# A tibble: 3 x 4
  col2      d     e     f
  <chr> <dbl> <dbl> <dbl>
1 a        51    56    59
2 b        63    55    62
3 c        39    59    56

您还可以使用alist()代替list()(看起来像I learned at one point,但此后却被忘了:-D)。

相关问题