📅  最后修改于: 2023-12-03 15:34:13.778000             🧑  作者: Mango
Excel 二进制工作簿 (XLSB) 是一种 Excel 文件格式,其具有比 XLSX 更高的速度和较小的文件大小。然而,Pandas 只支持读取 XLSX 格式的 Excel 文件。本篇文章将介绍如何使用 Pandas 读取 XLSB 文件。
Pandas 是一款开放源代码数据分析和操作工具。它可以将数据集导入 Python,对其进行操作、处理和分析,最终将数据集导出,并生成可视化结果。Pandas 提供了两个主要的数据结构,即 Series 和 DataFrame。
要读取 XLSB 文件,我们需要使用第三方库 pyxlsb。
首先需要安装 pyxlsb
:
!pip install pyxlsb
接着,使用 Pandas 读取 XLSB 文件:
import pandas as pd
from xlsb import open_workbook
with open_workbook('example.xlsb') as wb:
with wb.get_sheet('Sheet1') as sheet:
data = sheet.export()
df = pd.DataFrame(data[1:], columns=data[0])
代码解释:
首先导入 Pandas 和 open_workbook
函数。
使用 with
语句打开 XLSB 文件,然后使用 get_sheet
函数打开特定的工作表。
使用 export
函数将工作表中的数据导出到一个二维列表中。
最后,使用 Pandas 将二维列表转换成 DataFrame。
假设我们有一个名为 example.xlsb
的 XLSB 文件,其包含以下内容:
| | A | B | C | |---|------|------|------| | 1 | Name | Age | City | | 2 | John | 28 | NYC | | 3 | Mary | 30 | LA | | 4 | Jack | 25 | CHI |
使用上述代码将其读取并转换成 Pandas DataFrame:
>>> print(df)
Name Age City
0 John 28 NYC
1 Mary 30 LA
2 Jack 25 CHI
本文介绍了如何使用 Pyxlsb 将 XLSB 文件读取并转换成 Pandas DataFrame。读取 XLSB 与读取 XLSX 并没有太大区别,只要使用 open_workbook
函数打开相应的文件即可。