Question

我想删除重复的行：第一列C1可以重复，但如果所有其他列与C2 = C3 = C4 = C5相同，我只需要保留一个副本：

示例：

C1        C2          C3   C4   C5
7163003  17/09/2008   GE    A   45
7163003  17/09/2008   GE    A   45
7163003  08/06/2009   GE    B   50
7163003  22/12/2011   GE    C   45

结果：

C1        C2          C3   C4   C5
7163003  17/09/2008   GE    A   45
7163003  08/06/2009   GE    B   50
7163003  22/12/2011   GE    C   45

Answer 1

mydata<-data.frame(C1=c(LETTERS,LETTERS),C2=c(LETTERS,LETTERS),C3=c(LETTERS,LETTERS),C4=c(LETTERS,LETTERS),C5=c(LETTERS,LETTERS))
mydata
mydata[!duplicated(mydata$C1),]

Answer 2

dplyr解决方案使用distinct：

library(dplyr)

distinct(df)  

       C1         C2 C3 C4 C5
1 7163003 17/09/2008 GE  A 45
2 7163003 08/06/2009 GE  B 50
3 7163003 22/12/2011 GE  C 45

从数据框

2 个答案: