熊猫重新采样/石斑鱼和独特的行

时间:2017-07-20 21:14:45

标签: python pandas

我有一个格式为的数据框:

                 bank_number  pixel_id
00:00:00                   1    773872
00:00:00.000001            1    754607
00:00:00.000002            2    758142
00:00:00.000003            2    780649
00:00:00.000004            1    734804

我想根据索引的频率计算唯一条目的数量(bank_numberpixel_id)。

我可以使用df.resample("100us")df.groupby(pd.Grouper(freq='100us'))按频率对索引进行重新取样/分组。 E.g:

In [10]: df.resample("100us").sum()
Out[10]: 
                 bank_number      pixel_id
00:00:00              100000   75387050532
00:00:00.000100       100000   75375499992
00:00:00.000200       100000   75383627514
00:00:00.000300       100000   75385717582

我可以使用df.groupby(["bank_number", "pixel_id"]).size()获取唯一条目:

bank_number  pixel_id
0            1311297     1
             1311303     1
             1311304     5

但不是两个在一起...... 非常感谢帮助。

1 个答案:

答案 0 :(得分:0)

您可以通过连接bank_number和pixel_id

来创建第3列bank_pixel_id

然后再做

df.groupby(pd.Grouper(freq='100us'))['bank_pixel_id'].agg('count')