我需要一些帮助构建数据。所以我有以下DataFrame(称为df):
我想基于Mean_CArea,Mean_CPressure和Mean_Force对我的数据帧进行分组。但是,我得到了以下结果:
如您所见,列名称为0,1,2而不是NATIVE_RH,ANATOMICAL_RH和NON_ANATOMICAL_RH。有没有办法从原始数据框中获取正确的列名?
到目前为止,这是我的代码:
def function(self, df):
d = dict()
for head in df.columns.tolist():
RH, j_mechanics = head
if j_mechanics not in d:
d[j_mechanics] = df[head]
else:
d[j_mechanics] = pd.concat([d[j_mechanics],df[head]], axis=1, ignore_index=True)
for df_name, df in sorted(d.items()):
print(df_name)
print(df.head())
提前非常感谢!
答案 0 :(得分:2)
IIUC您可以swaplevel
使用groupby
按列(axis=1
)和第一级(level=0
):
df = pd.DataFrame({('B', 'a'): {0: 4, 1: 10}, ('B', 'b'): {0: 5, 1: 11}, ('B', 'c'): {0: 6, 1: 12}, ('A', 'a'): {0: 1, 1: 7}, ('A', 'c'): {0: 3, 1: 9}, ('A', 'b'): {0: 2, 1: 8}})
print (df)
A B
a b c a b c
0 1 2 3 4 5 6
1 7 8 9 10 11 12
df.columns = df.columns.swaplevel(0,1)
for i, g in df.groupby(level=0, axis=1):
print (g)
a
A B
0 1 4
1 7 10
b
A B
0 2 5
1 8 11
c
A B
0 3 6
1 9 12
答案 1 :(得分:1)
您想使用var level = url.replace(/[^\/]/g, "").length - 2;
xs
和
df.xs('Mean_CArea', axis=1, level=1)
和
df.xs('Mean_CPressure', axis=1, level=1)