我有一个数据框,其中一列 (col_a) 中的值重复,另一列 (col_b) 中的值重复。
我只想选择在一列 (col_a) 中具有相同值但在另一列 (col_b) 中具有不同值的行。
原始数据框
col_a col_b col_c
0 1 2 1
1 1 2 1
2 3 20 1
3 3 18 1
4 3 20 1
5 3 18 1
所需的数据帧
col_a col_b col_c
2 3 20 1
3 3 18 1
4 3 20 1
5 3 18 1
我尝试使用 df.duplicate 但它不起作用,因为我在两列中都有重复的值。我只想选择在 b 列中具有不同值但在 a 列中具有相同值的行。
答案 0 :(得分:0)
你可以这样做。
df[df["col_a"] != df["col_b"]]