ggplot2 facet_wrap混乱数据

时间:2018-01-05 20:44:56

标签: r plot ggplot2 facet-wrap

我有时间报告的数据框。相关列是(带有示例数据):

  • :A,B,C,...(字符类型)
  • 小时:2.5,1,6,...(数字类型)
  • yearMonth :2016-02,2017-11,2014-09,...(字符类型)

我用这个来绘制所有数据的条形图:

ggplot(data = time_reports, aes(x=time_reports$yearMonth, y=time_reports$Hours)) +
geom_col()

根据标准工作周和团队中当月报告的员工数量(该团队在此期间增长,并且几名员工在加入该团队后几个月没有开始报告时间),该情节是合理的。球队): bar chart showing sum of time-tracked hours per month

x轴标签为 time_reports $ yearMonth ,从2014年中期到2017年底.Y轴标签 time_reports $ Hours 并进行测量几小时。每个条形码是每月报告的小时数。

现在让我添加一个方面。这是新代码,添加了facet_wrap

ggplot(data =time_reports, aes(x=time_reports$yearMonth, y=time_reports$Hours)) +
geom_col() +
facet_wrap(~Person)

我得到8个方面,这是预期的,因为该团队有8个成员。但是,所有方面都有虚假数据。例如,这是一个方面: facet showing monthly hours for one employee

该员工直到2015年中才加入团队,直到2016年初才开始跟踪。此外,该员工自开始练习以来一直在努力追踪时间。你应该看到的是在这个情节的中途开始的相当水平的酒吧。 (对不起,此刻面位于刻面的中间,因此X和Y刻度不在它旁边.X刻度与此页面上的先前绘图相同,Y与下一个绘图相同页。)

我将数据框导出为CSV。我使用Excel的过滤和数据透视表功能来确认基础数据是否合理,并且数据中不存在ggplot2显示的内容。

这是另一个方面: facet showing monthly hours for one employee

这个超出了疯狂。对于这个人每个月报告800小时,这意味着每天工作超过24小时!再次,Excel证明基础数据没有显示远程类似的任何工作月。这个人在一个月内报告的最多是176.75小时。

为什么ggplot2' s facet_wrap功能如此糟糕地扭曲数据?

0 个答案:

没有答案
相关问题