通过分位数在密度曲线下的阴影(填充或颜色)区域

时间:2014-11-28 13:13:09

标签: r ggplot2

假设,例如我想通过十分位对标准正态分布的密度曲线下面积进行阴影处理。我希望最左边10%的区域对下一个10%有不同的阴影,依此类推。

这是问题的变体" Shading a kernel density plot between two points"和" ggplot2 shade area under density curve by group",但我想要每个分位数(在我的例子中,每个组都是十分位数,但过程应该很容易推广到其他分位数)。

我不介意解决方案是使用ggplot2还是base图形,以及这是直接从公式(非常简洁)或基于制作数据框架来完成的第一。如果是后者,您可能需要:

delta <- 0.0001 
z.df <- data.frame(x = seq(from=-3, to=3, by=delta))
z.df$pdf <- dnorm(z.df$x)
z.df$decile <- floor(10*pnorm(z.df$x) + 1)

请注意,天真的解决方案ggplot(z.df, aes(x = x, fill = quantile)) + geom_ribbon(aes(ymin = 0, ymax = pdf))会失败,因为Aesthetics can not vary with a ribbon

2 个答案:

答案 0 :(得分:11)

实际上美学可能会因geom_ribbon(...)(或geom_area(...),这基本上是相同的事情)而有所不同,只要您设置group美学。

delta     <- 0.001 
quantiles <- 10
z.df     <- data.frame(x = seq(from=-3, to=3, by=delta))
z.df$pdf <- dnorm(z.df$x)
z.df$qt  <- cut(pnorm(z.df$x),breaks=quantiles,labels=F)

library(ggplot2)
ggplot(z.df,aes(x=x,y=pdf))+
  geom_area(aes(x=x,y=pdf,group=qt,fill=qt),color="black")+
  scale_fill_gradient2(midpoint=median(unique(z.df$qt)), guide="none") +
  theme_bw()

在开头设置quantiles <- 20会产生以下结果:

答案 1 :(得分:4)

有效且可以概括的东西:

require(ggplot2)
g <- ggplot(z.df, aes(x=x, y=pdf, fill=decile)) +
    scale_fill_gradient2(midpoint=5.5, guide="none") +
    theme_bw()
for(n in 1:10) {
    g <- g + geom_ribbon(data=z.df[z.df$decile == n,], aes(ymin=0, ymax=pdf), colour = "black")
}
print(g)

我不觉得这特别令人满意,因为(1)我必须为每个十分位数添加一个功能区,以及(2)如果我在R I&#39中使用for循环; m通常做错了。

但它给出的情节是合理的:

Normal distribution curve with shaded deciles