Question

我有一个数据框，其中一列 (col_a) 中的值重复，另一列 (col_b) 中的值重复。

我只想选择在一列 (col_a) 中具有相同值但在另一列 (col_b) 中具有不同值的行。

原始数据框

  col_a col_b col_c
0   1    2     1
1   1    2     1
2   3    20    1
3   3    18    1
4   3    20    1
5   3    18    1

所需的数据帧

  col_a col_b col_c
2   3    20    1
3   3    18    1
4   3    20    1
5   3    18    1

我尝试使用 df.duplicate 但它不起作用，因为我在两列中都有重复的值。我只想选择在 b 列中具有不同值但在 a 列中具有相同值的行。

Answer 1

你可以这样做。

df[df["col_a"] != df["col_b"]]