找出R表中的列是否包含重复值?

时间:2012-11-27 22:05:04

标签: r duplicates

我有一个可爱的数据帧,我的第一个,我开始得到R的一个东西。我无法找到的一件事是重复值的测试。我有一个专栏,我很确定它是所有独特的值,但我不知道。

我可以问一下吗?为简单起见,我们假装这是我的数据:

  var1 var2 var3
1    1    A    1
2    2    B    3
3    3    C   NA
4    4    D   NA
5    5    E    4

我想知道var1是否会重复。

2 个答案:

答案 0 :(得分:13)

查看duplicated功能:

duplicated(dat$var1) # the rows of dat var1 duplicated

文档为here

您还应该查看unique函数。

答案 1 :(得分:2)

根据列删除重复项:

my_data[!duplicated(my_data$Col_id), ]  # Where ! is a logical negation: