根据两个变量中的重复项删除行

时间:2018-11-21 09:58:48

标签: r

我有一个看起来像这样的数据框

df <- "Name Value1 Value2 Value3 Value4
 John         a  b    c      d
 John         z  e    d      g        
  Sarah       a  c    e      i
  Sarah       a  f    e      f"
Data <- read.table(text=df, header = TRUE)

我现在想做的是,也删除在Value3中具有相同名称和相同值的所有行。这意味着我想为约翰保留两行,但为莎拉保留一行。

我尝试过

df <- df %>% distinct(Name, Value3, .keep_all = TRUE)

但这将忽略第二个参数,并删除两个人的第二行。我也尝试过与

合作
duplicated(df)

但是由于数据帧没有确切的重复项,所以这使我剩下全部四行。

我非常感谢您的建议。请注意,实际数据框确实很大。

0 个答案:

没有答案