DataFrame Pandas-使用索引和列名称作为新列名称来展平数据框

时间:2018-11-07 08:33:51

标签: python pandas dataframe

这是我的问题。

我有一个像这样的数据框

   A B C
d1 1 2 3
d2 4 5 6

我想生成这样的数据框。

   A-d1 B-d1 C-d1 A-d2 B-d2 C-d2
    1    2    3    4    5    6

1 个答案:

答案 0 :(得分:1)

stack用于带有MultiIndex的Series,然后将其展平以列表理解并传递给DataFrame构造函数:

s = df.stack()
#python 3.6+
df1 = pd.DataFrame([s.values],  columns=[f'{j}-{i}' for i, j in s.index])
#python bellow 3.6
#df1 = pd.DataFrame([s.values],  columns=['{}-{}'.format(i, j) for i, j in s.index])
print (df1)
   A-d1  B-d1  C-d1  A-d2  B-d2  C-d2
0     1     2     3     4     5     6

或通过numpy.ravel展平数据并通过itertools.product创建新列:

from  itertools import product

c = [f'{j}-{i}' for i, j in product(df.index, df.columns)]
df1 = pd.DataFrame([df.values.ravel()], columns=c)
print (df1)
   A-d1  B-d1  C-d1  A-d2  B-d2  C-d2
0     1     2     3     4     5     6