Pandas使用旧列名

时间:2016-07-13 05:38:25

标签: python pandas dataframe multiple-columns

我需要一些帮助构建数据。所以我有以下DataFrame(称为df): the original dataframe

我想基于Mean_CArea,Mean_CPressure和Mean_Force对我的数据帧进行分组。但是,我得到了以下结果:

wrongresult

如您所见,列名称为0,1,2而不是NATIVE_RH,ANATOMICAL_RH和NON_ANATOMICAL_RH。有没有办法从原始数据框中获取正确的列名?

到目前为止,这是我的代码:

def function(self, df):
    d = dict()
    for head in df.columns.tolist():
        RH, j_mechanics = head
        if j_mechanics not in d:
            d[j_mechanics] = df[head]
        else:
            d[j_mechanics] = pd.concat([d[j_mechanics],df[head]], axis=1, ignore_index=True)
    for df_name, df in sorted(d.items()):
        print(df_name)
        print(df.head())

提前非常感谢!

2 个答案:

答案 0 :(得分:2)

IIUC您可以swaplevel使用groupby按列(axis=1)和第一级(level=0):

df = pd.DataFrame({('B', 'a'): {0: 4, 1: 10}, ('B', 'b'): {0: 5, 1: 11}, ('B', 'c'): {0: 6, 1: 12}, ('A', 'a'): {0: 1, 1: 7}, ('A', 'c'): {0: 3, 1: 9}, ('A', 'b'): {0: 2, 1: 8}})

print (df)
   A         B        
   a  b  c   a   b   c
0  1  2  3   4   5   6
1  7  8  9  10  11  12
df.columns = df.columns.swaplevel(0,1)

for i, g in df.groupby(level=0, axis=1):
    print (g)
   a    
   A   B
0  1   4
1  7  10
   b    
   A   B
0  2   5
1  8  11
   c    
   A   B
0  3   6
1  9  12

答案 1 :(得分:1)

您想使用var level = url.replace(/[^\/]/g, "").length - 2;

xs

df.xs('Mean_CArea', axis=1, level=1)

df.xs('Mean_CPressure', axis=1, level=1)
相关问题