我目前有一个如下所示的数据框:
Owner Vehicle_Color
0 James Red
1 Peter Green
2 James Blue
3 Sally Blue
4 Steven Red
5 James Blue
6 James Red
7 Peter Blue
我正在尝试验证一位车主是否为该人分配了一种或多种车辆颜色。请记住,我的数据框为所有者提供了超过一百万个不同的条目(可能是重复的),什么是最佳解决方案?
由于
答案 0 :(得分:3)
一种方法是使用groupby
和nunique
:
df.groupby('Owner')['Vehicle_Color'].nunique()
结果:
Owner
James 2
Peter 2
Sally 1
Steven 1
Name: Vehicle_Color, dtype: int64