在 Python 中如何进行数据清洗并将结果导出到 Excel,同时为每列提供标题名称?

时间:2021-08-12 04:10:08

标签: python excel pandas data-cleaning

所以我尝试将多个 Excel 文件(大约有 20 个不同的)合并,清理数据然后使用 Python 导出结果到一个单独的 Excel 文件中。

这些 Excel 文件看起来像这样:

产品成本  性别   是否为主打商品
名称    价格    男     是 / 否
名称    价格    女     是 / 否
... 等等

以下是我的代码:

import pandas as pd
import pathlib

desktop_dir = pathlib.Path(r'C:/users/"myname"/Desktop')
files = desktop_dir.glob('*.XLSX')
data = []

for file in files:
    df = pd.read_excel(file)
    data.append(df)

df = pd.concat(data)

print(df)

array = df.to_numpy().tolist()

clean_array = [x[:-1] for x in array if x[1]<=20 and x[2] == "male" and x[-1]=='yes']

print(clean_array)

result = pd.DataFrame(clean_array)
result.to_excel('clean_data.xlsx')

现在代码已经可以工作了,但是“clean_data.xlsx”结果 Excel 文件中没有四个标题名称(产品成本、性别、是否为主打商品),我不确定如何添加它们而不手动输入。

请帮助我修复代码吗?感谢您的帮助。

0 个答案:

没有答案