ggvis:在单个图中组合多个数据集

时间:2015-10-14 16:31:15

标签: r plot ggplot2 ggvis

我读过similar post on SO,但无法根据具体情况调整答案。我正在使用时间序列数据,并希望将两个不同的数据集合并到同一个图中。虽然我可以将数据合并到一个数据框中,但我真的很想了解如何引用多个数据集。

模拟数据:

require(ggvis)

dfa <- data.frame(
date_a = seq(from= as.Date("2015-06-10"), 
        to= as.Date("2015-07-01"), by= 1),
val_a = c(2585.150, 2482.200, 3780.186, 3619.601, 
        0.000, 0.000, 3509.734, 3020.405, 
        3271.897, 3019.003, 3172.084, 0.000, 
        0.000, 3319.927, 2673.428, 3331.382, 
        3886.957, 2859.887, 0.000, 0.000, 
        2781.443, 2847.377) )

dfb <- data.frame(
date_b = seq(from= as.Date("2015-07-02"), 
        to= as.Date("2015-07-15"), by= 1),
val_b = c(3250.75429, 3505.43477, 3208.69141,
        -2.08175, -27.30244, 3324.62348, 
        2820.91075, 3250.75429, 3505.43477,
        3208.69141, -2.08175, -27.30244,
        3324.62348, 2820.91075) )

使用上面提供的数据,我可以使用以下代码创建单独的图:

单独的地块:(作品)

dfa %>%
ggvis( x= ~date_a , y= ~val_a, stroke := "black", opacity := 0.5 ) %>% 
    scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"),
    as.Date("2015-07-15") )) %>%
    layer_lines() %>% layer_points( fill := "black" )

dfb %>%
ggvis( x= ~date_b , y= ~val_b, stroke := "red", opacity := 0.5 ) %>% 
    scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"),
    as.Date("2015-07-15") )) %>%
    layer_lines() %>% layer_points( fill := "red" )

所需的输出是这两条线(黑色和红色)在同一个图上。以下是一些不成功的尝试:

尝试#1改编自SO post

ggvis( data = dfa, x = ~date_a, y = ~val_a) %>% layer_lines(stroke := "black",  opacity := 0.5 ) %>%
    layer_lines( data = dfb, x= ~date_b , y= ~val_b, stroke := "red", 
    opacity := 0.5 ) %>% 
    scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"), 
    as.Date("2015-07-15") )) 

## Error in new_prop.default(x, property, scale, offset, mult, env, event,  : 
##  Unknown input to prop: c(16618, 16619, 16620, 16621, 16622, 16623, 16624, ...

根据RStudio documentation尝试#2:

ggvis( data = NULL, x = ~date_a, y = ~val_a) %>%
    layer_lines(stroke := "black",  opacity := 0.5, data = dfa ) %>%
    layer_lines( x= ~date_b , y= ~val_b, stroke := "red", 
    opacity := 0.5, data = dfb ) %>% 
    scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"), 
    as.Date("2015-07-15") )) 

## Error in func() : attempt to apply non-function

这是ggplot2中的简约实现:

require(ggplot2)

ggplot() + 
  geom_line(data = dfa, aes(x = date_a, y = val_a ), colour = "black") +     
  geom_line(data = dfb, aes(x = date_b, y = val_b ), colour = "red") 

ggplot example

再次,非常感谢工作解决方案和简要说明。提前感谢您的帮助。

1 个答案:

答案 0 :(得分:5)

嗯,看起来layer_lines可能不适合采用data参数。我想你可以在这里成功使用layer_paths。它们的工作方式类似,但layer_paths按数据顺序工作,因此您需要确保在绘图之前正确排列时间序列。

首先,当我查看layer_paths基本函数时,与许多其他图层函数一样,它具有特定的数据参数。

layer_paths
function (vis, ..., data = NULL) 
{
    add_mark(vis, "line", props(..., env = parent.frame()), data, 
        deparse2(substitute(data)))
}
<environment: namespace:ggvis>

虽然layer_lines...来获取更多参数,但它没有data参数,并且它看起来似乎不适用于它。

layer_lines
function (vis, ...) 
{
    x_var <- vis$cur_props$x$value
    layer_f(vis, function(x) {
        x <- auto_group(x, exclude = c("x", "y"))
        x <- dplyr::arrange_(x, x_var)
        emit_paths(x, props(...))
    })
}
<environment: namespace:ggvis>

为了测试,我制作了一个非常基本的图表,尝试使用data中的layer_lines参数。

ggvis() %>%
    layer_lines(data = dfb, x= ~date_b , y= ~val_b, stroke := "red") 

失败并出现错误。

  

func()出错:尝试应用非功能

使用layer_paths来代替相同的代码:

ggvis() %>%
    layer_paths(data = dfb, x= ~date_b , y= ~val_b, stroke := "red") 

enter image description here

因此,这有效,这意味着只要您按日期订购数据集,只需将layer_lines替换为layer_paths,您的图表就可以正常工作。

ggvis(data = dfa, x = ~date_a, y = ~val_a) %>% 
    layer_paths(stroke := "black",  opacity := 0.5 ) %>%
    layer_paths(data = dfb, x = ~date_b , y= ~val_b, stroke := "red", 
                opacity := 0.5 ) %>% 
    scale_datetime("x", nice = "month", domain = c(as.Date("2015-06-10"), as.Date("2015-07-15") )) 

enter image description here

这对我来说似乎很奇怪,我错过了一些东西。我在ggvis github page的公开或已公开问题中没有看到任何内容,您可以考虑提交一个。