将函数应用于dplyr的group_by的输出

时间:2014-12-18 22:18:23

标签: r ggplot2 dplyr

我想将大型数据框子集化并创建每个分组的ggplot。听起来像dplyr的完美候选人,但我遇到了调用group_by结果上的函数的问题。任何提示都将不胜感激。

# what I want to do using base functions: "groupby" the elements in a column 
# and create/save a plot for each group
for (i in levels(iris$Species)){
  df = iris[iris$Species == i,]
  p <- ggplot(df, aes(x=Sepal.Length, y=Sepal.Width) + geom_point())
  ggsave(p, filename=paste(i,".pdf",sep=""))
}

# I'm trying to get something like this using dplyr
library(dplyr)
iris %>%
  group_by(Species) %>%
  do({
      p <- ggplot(., aes(x=Sepal.Length, y=Sepal.Width) + geom_point())
      ggsave(p, filename=paste(quote(Species),".pdf",sep=""))
     })

1 个答案:

答案 0 :(得分:10)

嗯,你有一个括号问题和一个文件命名问题,所以也许它是你所指的那个问题之一。我假设

iris %>%
  group_by(Species) %>%
  do({
      p <- ggplot(., aes(x=Sepal.Length, y=Sepal.Width)) + geom_point()
      ggsave(p, filename=paste0(unique(.$Species),".pdf"))
     })

可以解决您的问题。