重新定义数据框以进行R中的回归分析

时间:2018-11-26 13:30:59

标签: r dataframe missing-data

i有一个数据帧,带有从a到b的几次运输的时间戳,以及有关物料的信息(体积,重量等)。

Picture of the excel sheet I use

我重新创建了我使用的原始excel工作表的重要部分。

我的第一步是通过简单地减去日期来计算所需的时间,因为我只需要每日精度。我将所有时间都放在数值矢量中,以方便进行进一步的计算和绘图。

但是: 我想对其进行回归分析。我知道如何创建一个lm。 我的问题是,由于存在多个NA,“运输天数”的数值向量比df中的cols短。 如何将df中的cols与我的数值向量合并,以使传输时间再次与几种材料匹配?

1 个答案:

答案 0 :(得分:0)

您是否正在寻找

library(dplyr)
df %>% 
  mutate(diff = as.numeric(t4-t1))

然后,当colume列仍在df中时,将出现一个时差列。您可以告诉lm()无论如何如何处理NA,因此您无需删除它们(我也不认为您还是在这样做)。