从数据框

时间:2018-02-12 11:24:09

标签: r

我想删除重复的行:第一列C1可以重复,但如果所有其他列与C2 = C3 = C4 = C5相同,我只需要保留一个副本:

示例:

C1        C2          C3   C4   C5
7163003  17/09/2008   GE    A   45
7163003  17/09/2008   GE    A   45
7163003  08/06/2009   GE    B   50
7163003  22/12/2011   GE    C   45

结果:

C1        C2          C3   C4   C5
7163003  17/09/2008   GE    A   45
7163003  08/06/2009   GE    B   50
7163003  22/12/2011   GE    C   45

2 个答案:

答案 0 :(得分:2)

mydata<-data.frame(C1=c(LETTERS,LETTERS),C2=c(LETTERS,LETTERS),C3=c(LETTERS,LETTERS),C4=c(LETTERS,LETTERS),C5=c(LETTERS,LETTERS))
mydata
mydata[!duplicated(mydata$C1),]

答案 1 :(得分:0)

dplyr解决方案使用distinct

library(dplyr)

distinct(df)  

       C1         C2 C3 C4 C5
1 7163003 17/09/2008 GE  A 45
2 7163003 08/06/2009 GE  B 50
3 7163003 22/12/2011 GE  C 45