📅  最后修改于: 2023-12-03 15:33:18.228000             🧑  作者: Mango
openpyxl 是一种用于操作 Excel 电子表格的 Python 库。该库支持读取、写入、编辑 Excel 文件,并具有多种用于处理电子表格数据的实用功能。本篇介绍如何使用 openpyxl 读取 Excel 文件。
安装 openpyxl 的方法很简单,只需在命令行中输入以下命令即可:
pip install openpyxl
使用 openpyxl 读取 Excel 文件,您需要导入 openpyxl 库并使用以下代码打开 Excel 文件:
import openpyxl
wb = openpyxl.load_workbook('example.xlsx')
这会打开名为 "example.xlsx" 的 Excel 文件,并将其存储在 wb 变量中。您现在可以使用以下代码访问 Excel 文件中的工作表:
sheet = wb['Sheet1']
这将打开名为 "Sheet1" 的工作表,并将其存储在 sheet 变量中。
要读取单元格的值,可以使用以下示例代码:
cell = sheet['A1']
print(cell.value)
这将打印 A1 单元格的值。您也可以使用以下简写形式:
print(sheet['A1'].value)
单元格的值可以是任何类型,包括字符串、数字、日期等。
要循环遍历单元格,可以使用以下示例代码:
for row in sheet.iter_rows(min_row=1, max_row=3, min_col=1, max_col=3):
for cell in row:
print(cell.value)
这将遍历工作表中的前三行和前三列,并打印出每个单元格的值。
openpyxl 使用起来可能会有些繁琐。如果您想要更方便地读取 Excel 文件,并使用 Pandas 库对数据进行分析和处理,则可以将 openpyxl 与 Pandas 结合使用。
要将 Excel 文件读入 Pandas DataFrame 中,可以使用以下示例代码:
import pandas as pd
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
print(df.head())
这会将 "example.xlsx" 中的 "Sheet1" 工作表读取到 Pandas DataFrame 中,并打印 DataFrame 的前五行。
这篇文章介绍了如何使用 openpyxl 库读取 Excel 文件,并循环遍历单元格。如果您需要更方便地读取 Excel 文件,并使用 Pandas 库进行分析和处理,则可以将 openpyxl 与 Pandas 结合使用。openpyxl 具有多种实用功能,使用起来很方便,可以轻松地读取和编辑 Excel 文件。