如何将目录下的所有 excel 文件作为 Pandas DataFrame 读取?
在本文中,我们将看到如何将文件夹中的所有 Excel 文件读入单个 Pandas 数据帧。可以通过首先使用 glob() 方法查找特定文件夹中的所有 excel 文件,然后使用 pandas.read_excel() 方法读取文件,然后显示内容来执行该任务。
方法:
- 导入必要的Python包,如 pandas、glob 和 os。
- 使用 glob Python包检索匹配指定模式的文件/路径名,即“.xlsx”
- 循环遍历 excel 文件列表,使用 pandas.read_excel() 读取该文件。
- 将每个 excel 文件转换为数据框。
- 显示其位置、名称和内容。
下面是实现。
Python3
# import necessary libraries
import pandas as pd
import os
import glob
# use glob to get all the csv files
# in the folder
path = os.getcwd()
csv_files = glob.glob(os.path.join(path, "*.xlsx"))
# loop over the list of csv files
for f in csv_files:
# read the csv file
df = pd.read_excel(f)
# print the location and filename
print('Location:', f)
print('File Name:', f.split("\\")[-1])
# print the content
print('Content:')
display(df)
print()
输出 :
注意:程序读取程序本身所在文件夹中的所有 Excel 文件。