Df.drop /删除重复的行

时间:2017-03-28 17:49:23

标签: python pandas dataframe

如何删除行的完全重复项。所以如果我有一个看起来像这样的数据框:

A    B    C
1    2    3
3    2    2
1    2    3

现在我的数据框比这个要大很多,但是我们可以让python查看每一行,如果行中的值与另一行完全相同,只需删除或删除该行。我想考虑整个数据框,我不想指定我想获得唯一值的列。

2 个答案:

答案 0 :(得分:3)

您可以使用DataFrame.drop_duplicates()方法:

In [23]: df
Out[23]:
   A  B  C
0  1  2  3
1  3  2  2
2  1  2  3

In [24]: df.drop_duplicates()
Out[24]:
   A  B  C
0  1  2  3
1  3  2  2

答案 1 :(得分:2)

您可以使用.duplicated的倒数来获得重复数据删除的数据框:

df[~df.duplicated(['A','B','C'])]

返回:

>>> df[~df.duplicated(['A','B','C'])]
   A  B  C
0  1  2  3
1  3  2  2
相关问题