熊猫 - 计算买家和卖家之间的互动

时间:2014-04-15 01:49:17

标签: python-2.7 pandas

所以我遇到了一个编程问题,我发现它有点挑战性。我在买家和卖家ala上有几年的每日数据(位于Pandas DataFrame)。这样:

            Seller  Buyer   Amount  
2012/11/13  Bank1   Bank2   15                              
2012/11/13  Bank1   Bank2   17             
2012/11/13  Bank5   Bank3   5              
2012/11/14  Bank4   Bank2   10                  
2012/11/14  Bank1   Bank3   22      

索引是Pandas.DatetimeIndex。

我想在每个月的基础上计算每个购买银行的每月总交易量中有多少来自每个卖家,他们已与之互动。所以在上面的例子中,输出(最好是DataFrame)也是:

Month       Seller  Buyer   Share   
2012/11     Bank1   Bank2   32/42                               
2012/11     Bank4   Bank2   10/42              
2012/11     Bank5   Bank3   5/27               
2012/11     Bank1   Bank3   22/27               

非常感谢任何输入!

1 个答案:

答案 0 :(得分:0)

我已经向Github上传了一个IPython笔记本,应该开始回答你的问题了。你可以找到它here

这里的基本方法是进行DataFrame.groupby()操作。使用您提供的虚拟数据,我首先执行data.groupby('Buyer').sum(),将索引重置为买方,将总和添加为“总计”列,最后除以。

我不太确定如何处理时间序列的东西(即按月分组时,只有完整日期信息未分成年月日期)。如果其他人有建议,请发表评论,以便我可以更新笔记本和我的答案!