熊猫|将逗号分隔的组的所有值分组

时间:2018-05-19 07:16:54

标签: python pandas data-cleaning

根据应用程序要求,我需要以逗号分隔格式显示所有数据,这样管理员才能做出决定,我是Python的新手,不知道该怎么做。

样本可重复数据

import pandas as pd

compnaies = ['Microsoft', 'Google', 'Amazon', 'Microsoft', 'Facebook', 'Google']
products = ['OS', 'Search', 'E-comm', 'X-box', 'Social Media', 'Android']

df = pd.DataFrame({'company' : compnaies, 'product':products })
-----------------------------------------------------------------   
    company     product
0   Microsoft   OS
1   Google      Search
2   Amazon      E-comm
3   Microsoft   X-box
4   Facebook    Social Media
5   Google      Android

现在我按照这个代码计算公司集团的数量

df.groupby(['company']).count()

我需要下面提到的格式的数据,但不知道如何获得它

所需的输出

company    count product
Amazon      1    E-comm
Facebook    1    Social Media
Google      2    Search, Android
Microsoft   2    OS, X-box

1 个答案:

答案 0 :(得分:8)

您可以使用:

In [35]: df.groupby('company').product.agg([('count', 'count'), ('product', ', '.join)])
Out[35]: 
           count          product
company                          
Amazon         1           E-comm
Facebook       1     Social Media
Google         2  Search, Android
Microsoft      2        OS, X-box
相关问题