我正在尝试为一个项目合并两个数据集,并且对如何在相似的“名称”列下合并两个数据集感到好奇。我已经尝试过了,到目前为止,输出还没有打印出任何数据。
import pandas as pd
#importing the two datasets
Data1 = pd.read_csv('Desktop/MLB.csv')
Data2 = pd.read_csv('Downloads/Untitled spreadsheet - Sheet1.csv')
#making a name column to merge the two with
Data1['Name'] = (Data1['Last Name'] + ' ' + ',' + ' ' + '-' + Data1['First Name'].astype(str).str[0] + '-')
Data2['Name'] = Data2['Player']
#isolating the desired columns
Data3 = Data2.loc[:,['Pos', '-G-', '-AB-', '-R-', '-H-', '2B', '3B', '-HR-','RBI', 'BB', '-SO-', '-SB-', '-CS-', 'AVG▼', 'OBP', '-SLG-', 'OPS', 'Name']]
Data4 = Data1.loc[:,['Position', 'FPPG', 'Name']]
#merging the two datasets
Data5 = pd.merge(Data3, Data4, on='Name')
Data5
#the output
Pos -G- -AB- -R- -H- 2B 3B -HR- RBI BB -SO- -SB- -CS- AVG▼ OBP -SLG- OPS Name Position FPPG
任何帮助将不胜感激。
最好, 布伦丹。