将一个数据集中的变量分配给另一个数据集中的多个字段

时间:2019-03-01 18:51:51

标签: r dataframe data-cleaning

我正在尝试将一个数据帧中的变量分配给另一数据帧的多行中-即此处的AWND变量(平均风速)。

我正在尝试从那里获得AWND here

我正在尝试根据日期将其与多个日期匹配
here

这是我到目前为止尝试过的。

dfNew <- merge(dfWeather, dfFlight, by="DATE")

我不确定如何进行此操作。

我应该加入吗?

(编辑:这是数据-https://shrib.com/#-7dXevTkb12Bt6Kdfxim(这是我从中获取AWND的数据的dput输出)

我从nycflights13包中获得了航班数据(我想与之匹配的日期),然后我将flights数据子集化为仅包括至少有1000趟航班从拉瓜迪亚出发的航空公司。

1 个答案:

答案 0 :(得分:0)

flights数据具有日期时间类,如您的小标题中所示。首先,请确保您要加入的元素相同,即2013-01-01 05:00:00数据中的2013-01-01dfWeather不匹配。frame

# Make sure dates match between data.frames
dfFlight$DATE <- stringr::str_extract(dfFlight$DATE, "\\S*")

# Join AWND wherever dates match to left-hand side
dfNew <- dplyr::left_join(dfFlight, dfWeather, by = "DATE")

我确实假设过有关您的数据的某些事情,因为我无法从屏幕截图中完全看到您正在使用的内容。这是我对Stack Overflow的第一个答案,请随时编辑或给我建议