我正在尝试将各种文件中的其他dataframe列导入到一个文件中。
假设df1,df2和df3分别位于不同的.py文件中,但这些文件保存在同一文件夹中。
ie df1保存在df1.py中 df2保存在df2.py中 df3保存在df3.py
我试图找出如何将df2和df3中的列导入df1(具有7行),即使所有数据帧的行数都不同。
NaN行应表示为-(即破折号'-')
df1 = pd.DataFrame()
df1['A'] = (1,22,13,41,2,56,79)
df1['B'] = ('B','S','S', 'S', 'S', 'B', 'B')
df1['C'] = (1.02, 1.01, 1.44, 1.05, 1.05, 1.12, 1.22)
df2 = pd.DataFrame()
df2['D'] = (11,65,8,34,56,18,91,34,89,35,3,9,15)
df2['E'] = ('E','R','Y', 'N', 'X', 'T','Y', 'N', 'X', 'T', 'D', 'T', 'D')
df2['F'] = (1.02, 1.01, 1.44, 1.05,1.02, 1.01, 1.44, 1.05, 1.05, 1.12, 1.22, 1.12, 1.22)
df3 = pd.DataFrame()
df3['G'] = (1,22,13)
df3['H'] = ('S','S', 'S')
df3['I'] = (1.05, 1.05, 1.12)
打印以下内容是我希望df1导入后的样子
df1 = pd.DataFrame()
df1['A'] = (1,22,13,41,2,56,79)
df1['B'] = ('B','S','S', 'S', 'S', 'B', 'B')
df1['C'] = (1.02, 1.01, 1.44, 1.05, 1.05, 1.12, 1.22)
df1['D'] = (11,65,8,34,56,18,91)
df1['E'] = ('E','R','Y', 'N', 'X', 'T','Y')
df1['F'] = (1.02, 1.01, 1.44, 1.05,1.02, 1.01, 1.44)
df1['G'] = (1,22,13, '-', '-', '-', '-')
df1['H'] = ('S','S', 'S', '-', '-', '-', '-')
df1['I'] = (1.05, 1.05, 1.12, '-', '-', '-', '-')
print(df1)
答案 0 :(得分:0)
使用-
print(pd.concat([df1, df2, df3], axis=1).dropna(subset=['A', 'B', 'C']).fillna('-'))
输出
A B C D E F G H I
0 1.0 B 1.02 11 E 1.02 1 S 1.05
1 22.0 S 1.01 65 R 1.01 22 S 1.05
2 13.0 S 1.44 8 Y 1.44 13 S 1.12
3 41.0 S 1.05 34 N 1.05 - - -
4 2.0 S 1.05 56 X 1.02 - - -
5 56.0 B 1.12 18 T 1.01 - - -
6 79.0 B 1.22 91 Y 1.44 - - -
答案 1 :(得分:0)
您可以尝试:
import pandas as pd
import df1, df2, df3 # import files df1.py, df2.py and df3.py
print(pd.concat([df1.df1, df2.df2.iloc[:df1.df1.shape[0]], df3.df3], axis=1, sort=False).fillna('-'))
结果:
A B C D E F G H I
0 1 B 1.02 11 E 1.02 1 S 1.05
1 22 S 1.01 65 R 1.01 22 S 1.05
2 13 S 1.44 8 Y 1.44 13 S 1.12
3 41 S 1.05 34 N 1.05 - - -
4 2 S 1.05 56 X 1.02 - - -
5 56 B 1.12 18 T 1.01 - - -
6 79 B 1.22 91 Y 1.44 - - -