我在一个文件夹中大约有200个CSV文件,并且某些列的名称不同,例如存在“应用程序名称”,“应用程序名称”和“应用程序名称”,因此我想重命名此类列命名为“应用程序名称”之类的标准名称,并将所有CSV文件连接到一个CSV文件中,
答案 0 :(得分:1)
那行得通:
import glob
import os
import pandas as pd
folder = 'the folder path'
filenames = [i for i in glob.glob(folder + os.path.sep + '*.csv')]
combined_csv = pd.concat([pd.read_csv(f, skiprows=1) for f in filenames])
combined_csv.columns = ["all the header labels"]
答案 1 :(得分:0)
import glob
import pandas as pd
csv_folder = '/Users/yourname/folder_containing_csv/*.csv'
csv_file_list = []
for csv_path in glob.glob(csv_folder):
csv_file_list.append(csv_path)
for i in range(len(csv_file_list)):
df = pd.read_csv(csv_file_list[i], index_col=0)
df = df.rename(columns={"old_name": "new_name"})
file_name = str(csv_file_list[i]).split('.csv')[0].split('/')[-1:][0] # get file name by subsetting the path
df.to_csv('/Users/yourname/%(file_name)s.csv'%{'file_name': file_name}) # save to .csv using the same file name