📅  最后修改于: 2023-12-03 14:53:49.029000             🧑  作者: Mango
有时候我们需要处理多个 Excel 文件,其中每个文件包含多个工作表。在这种情况下,我们可以使用 Python 的 Pandas 库来合并这些工作表到一个数据框中,以便更方便地进行处理和分析。
以下是将多个 Excel 工作表合并到一个 Pandas 数据框的步骤:
首先,我们需要导入 Pandas 库和其他必要的库,以便在程序中使用。
import pandas as pd
import glob
使用 glob
库和通配符来获取目标文件夹中所有 Excel 文件的文件名。可以根据实际情况修改通配符以匹配文件名的模式。
file_names = glob.glob("path/to/folder/*.xlsx")
遍历每个 Excel 文件的文件名,并读取每个文件中的所有工作表,并将它们合并到一个 Pandas 数据框中。
dfs = [] # 用于存储所有工作表的数据框
for file_name in file_names:
excel_file = pd.ExcelFile(file_name) # 读取 Excel 文件
sheet_names = excel_file.sheet_names # 获取该文件中所有工作表的名称
for sheet_name in sheet_names:
df = excel_file.parse(sheet_name) # 读取工作表的数据
dfs.append(df) # 将数据存储到列表中
merged_df = pd.concat(dfs, ignore_index=True) # 将所有工作表的数据进行合并
现在,你可以对合并后的数据框进行任何处理和分析操作,如数据清洗、转换、计算等。
# 进行数据清洗、转换或计算
merged_df['new_column'] = merged_df['column1'] + merged_df['column2']
当然,根据实际需求,你可以根据需要对合并后的数据框进行任何其他操作。
以上就是将多个 Excel 工作表合并到一个 Pandas 数据框中的步骤。通过将这些工作表合并到一个数据框中,我们可以更方便地处理和分析数据,提高工作效率。
注意:在运行代码之前,请确保已经安装了 pandas 和 glob 库,并替换
"path/to/folder/*.xlsx"
字符串为实际的文件路径和通配符。
希望这个介绍对你有帮助!