Question

我有2个数据帧列，如下所示：

df1 = pd.DataFrame({'A':['CINO','KONO','ROLO','MANE','TUTU']})
df2 = pd.DataFrame({'B':['NION','PONO','RZCO','MPPE','TQAS']})

我的想法是以一种输出如下所示的方式组合数据帧：

        C
CC1  CINO   <---- belongs to A
CC1  NION  <---- belongs to B
CC2  KONO   <---- belongs to A    
CC2  PONO  <---- belongs to B
CC3  ROLO   <---- belongs to A
CC3  RZCO  <---- belongs to B
CC4  MANE   <---- belongs to A
CC4  MPPE  <---- belongs to B
CC5  TUTU   <---- belongs to A
CC5  TQAS  <---- belongs to B

正如您所见，列B的项目位于列A的行之间。请注意行的命名方式，使每对行具有相同的名称。

你能用一些内置的Pandas功能建议我一个聪明的方法来实现这个目标吗？

Answer 1

pd.concat(
    [df1, df2], axis=1
).stack().reset_index(1, drop=True).to_frame('C').rename(index='CC{}'.format)

        C
CC0  CINO
CC0  NION
CC1  KONO
CC1  PONO
CC2  ROLO
CC2  RZCO
CC3  MANE
CC3  MPPE
CC4  TUTU
CC4  TQAS

Answer 2

您可以使用：

df = pd.concat([df1.rename(columns={'A':'C'}),
                df2.rename(columns={'B':'C'})], keys=[1,2])
       .sort_index(level=[1,0])
       .reset_index(level=0, drop=True)
df.index = 'CC' + df.index.astype(str)
print (df)
        C
CC0  CINO
CC0  NION
CC1  KONO
CC1  PONO
CC2  ROLO
CC2  RZCO
CC3  MANE
CC3  MPPE
CC4  TUTU
CC4  TQAS

使用Pandas的不同列的替代元素

2 个答案: