📅  最后修改于: 2023-12-03 15:36:37.095000             🧑  作者: Mango
在实际的工作中,我们经常需要读取Excel文件中的数据并对其进行处理。Python提供了多种库可以实现读取Excel文件的功能,本文将介绍其中的三种:xlrd、pandas、openpyxl。
xlrd
是Python中用于读取Excel文件的库,它能够读取.xlsx和.xls格式的Excel文件。
首先,我们需要安装xlrd
库。
pip install xlrd
读取Excel文件的基本步骤:
下面是一个读取Excel文件的示例代码:
import xlrd
# 打开Excel文件
workbook = xlrd.open_workbook('example.xlsx')
# 获取所有工作表名字
sheet_names = workbook.sheet_names()
print(sheet_names)
# 获取第一个工作表
worksheet = workbook.sheet_by_index(0)
# 获取第二行第三列的单元格的值
cell_value = worksheet.cell_value(1, 2)
print(cell_value)
pandas
是Python中用于数据处理的主要库之一,它也可以读取Excel文件,并将其转换为DataFrame
格式。
首先,我们需要安装pandas
库。
pip install pandas
读取Excel文件的基本步骤:
DataFrame
格式。下面是一个读取Excel文件的示例代码:
import pandas as pd
# 打开Excel文件并读取第一个工作表转换为DataFrame格式
df = pd.read_excel('example.xlsx', sheet_name=0)
# 输出DataFrame的前5行
print(df.head())
通过pandas
库,我们可以非常方便地对Excel文件中的数据进行处理,例如对数据进行筛选、排序、统计等操作。
openpyxl
是Python中用于读写Excel文件的库,它类似于xlrd
和xlwt
库,但支持更多的Excel功能,例如合并单元格、添加图表等。
首先,我们需要安装openpyxl
库。
pip install openpyxl
读取Excel文件的基本步骤:
下面是一个读取Excel文件的示例代码:
from openpyxl import load_workbook
# 打开Excel文件
workbook = load_workbook(filename='example.xlsx')
# 获取第一个工作表
worksheet = workbook['Sheet1']
# 获取第二行第三列的单元格的值
cell_value = worksheet.cell(row=2, column=3).value
print(cell_value)
与以上两种库不同,openpyxl
库支持对Excel文件进行写入(如修改、添加数据等)的操作。
总结
以上就是Python中常见的读取Excel文件的三种方法,分别是xlrd
、pandas
和openpyxl
。不同的库适用于不同的场景,程序员可以根据具体需求选择使用。
参考文献: