检查不同列中变量的唯一值

时间:2018-05-28 00:20:58

标签: python pandas dataframe

我目前有一个如下所示的数据框:

            Owner        Vehicle_Color
0          James              Red
1          Peter              Green
2          James              Blue
3          Sally              Blue
4          Steven             Red
5          James              Blue
6          James              Red
7          Peter              Blue

我正在尝试验证一位车主是否为该人分配了一种或多种车辆颜色。请记住,我的数据框为所有者提供了超过一百万个不同的条目(可能是重复的),什么是最佳解决方案?

由于

1 个答案:

答案 0 :(得分:3)

一种方法是使用groupbynunique

df.groupby('Owner')['Vehicle_Color'].nunique()

结果:

Owner
James     2
Peter     2
Sally     1
Steven    1
Name: Vehicle_Color, dtype: int64