我有一个看起来像这样的数据框
df <- "Name Value1 Value2 Value3 Value4
John a b c d
John z e d g
Sarah a c e i
Sarah a f e f"
Data <- read.table(text=df, header = TRUE)
我现在想做的是,也删除在Value3中具有相同名称和相同值的所有行。这意味着我想为约翰保留两行,但为莎拉保留一行。
我尝试过
df <- df %>% distinct(Name, Value3, .keep_all = TRUE)
但这将忽略第二个参数,并删除两个人的第二行。我也尝试过与
合作duplicated(df)
但是由于数据帧没有确切的重复项,所以这使我剩下全部四行。
我非常感谢您的建议。请注意,实际数据框确实很大。