python - 熊猫groupby对象唯一计数性能

我有一个庞大的交易数据集，看起来像：

| cust_no | acct_no | trans_id | product_id | ..... |

我尝试了几种方法来计算每个客户有多少个唯一帐户，以及客户购买了多少个独特产品等等。

transaction_df[['cust_no','acct_no']].groupby('cust_no')['acct_no'].nunique()

平均运行91.5毫秒

transaction_df.groupby('cust_no')['acct_no'].nunique()

平均运行85.5毫秒

transaction_df[['cust_no','acct_no']].groupby(['cust_no','acct_no']).size().groupby('cust_no').size()

运行61.5毫秒

transaction_df.groupby(['cust_no','acct_no']).size().groupby('cust_no').size()

运行55.3毫秒

我有两个问题：

切片后的DataFrame为什么运行得更慢，即transaction_df[['cust_no','acct_no']]比transaction_df还要慢？
为什么.nunique()方法比仅堆叠两个groupby慢得多？