大熊猫中的聚集和多个联接

时间:2018-12-07 23:32:50

标签: python pandas

我正在学习熊猫,但是我对它的工作方式感到困惑。 如果我有此数据框:

   name        region_id  device  prod_id        date
0  NAME_01     442317     TV      169398  2012-02-01
1  NAME_01      89803     TV       87465  2012-03-01
2  NAME_02       9157     TV       73769  2012-03-01
3  NAME_02     145563     TV       76560  2012-03-01
4  NAME_03     412738     TV       87786  2012-03-01

如何获取每个名称的region_id列表?例如,我需要这个:

NAME_01: [442317, 89803]
NAME_02: [9157, 145563]
NAME_03: [412738]

感谢RafaelC。

接着,从上方迭代结果的最佳方法是什么?对于每个ID(在每个名称中),我将在另一个数据框中找到出现的位置,并且需要计数,即每个ID在第二个数据框中包含的总次数。示例:

   region_id
0     442317
1     442317
2     442317
3     9157
4     9157

因此,对于属于一个名称的每个id(来自第一个数据帧),我可以看到在第二个数据帧中可以找到此计数:

name     region_id   count
NAME_01  442317      3
...
NAME_02  9157        2
...

如何执行该操作?

0 个答案:

没有答案
相关问题