📅  最后修改于: 2023-12-03 15:36:59.847000             🧑  作者: Mango
当我们需要处理一些 Excel 文件数据时,经常需要加载最新的 Excel 文件并从中读取数据。下面介绍几种方法来实现这个目标。
这种方法假设 Excel 文件名是按照一定规则命名的(例如按时间顺序),并且文件名的最大值就是最新文件的文件名。具体操作如下:
import os
# 列出当前文件夹下所有 Excel 文件
files = os.listdir('.')
excels = [file for file in files if file.endswith('.xlsx')]
# 获取文件名的最大值
latest_excel = max(excels)
# 加载最新的 Excel 文件
df = pd.read_excel(latest_excel)
如果方法一中的假设不成立,我们可以按文件的创建时间来确定最新文件。具体操作如下:
import os
# 列出当前文件夹下所有 Excel 文件
files = os.listdir('.')
excels = [file for file in files if file.endswith('.xlsx')]
# 按创建时间排序
excels.sort(key=lambda x: os.path.getctime(x))
# 加载最新的 Excel 文件
df = pd.read_excel(excels[-1])
除了按创建时间排序外,我们还可以按文件修改时间排序来确定最新文件。具体操作如下:
import os
# 列出当前文件夹下所有 Excel 文件
files = os.listdir('.')
excels = [file for file in files if file.endswith('.xlsx')]
# 按修改时间排序
excels.sort(key=lambda x: os.path.getmtime(x))
# 加载最新的 Excel 文件
df = pd.read_excel(excels[-1])
以上三种方法都可以实现加载最新的 Excel 文件,具体使用哪一种取决于你的文件名规则和需要。