📜  python 读取 xlsb pandas - Python (1)

📅  最后修改于: 2023-12-03 15:34:13.778000             🧑  作者: Mango

Python 读取 XLSB 文件的 Pandas

Excel 二进制工作簿 (XLSB) 是一种 Excel 文件格式,其具有比 XLSX 更高的速度和较小的文件大小。然而,Pandas 只支持读取 XLSX 格式的 Excel 文件。本篇文章将介绍如何使用 Pandas 读取 XLSB 文件。

Pandas

Pandas 是一款开放源代码数据分析和操作工具。它可以将数据集导入 Python,对其进行操作、处理和分析,最终将数据集导出,并生成可视化结果。Pandas 提供了两个主要的数据结构,即 Series 和 DataFrame。

读取 XLSB 文件

要读取 XLSB 文件,我们需要使用第三方库 pyxlsb

首先需要安装 pyxlsb

!pip install pyxlsb

接着,使用 Pandas 读取 XLSB 文件:

import pandas as pd
from xlsb import open_workbook

with open_workbook('example.xlsb') as wb:
    with wb.get_sheet('Sheet1') as sheet:
        data = sheet.export()
        
df = pd.DataFrame(data[1:], columns=data[0])

代码解释:

首先导入 Pandas 和 open_workbook 函数。

使用 with 语句打开 XLSB 文件,然后使用 get_sheet 函数打开特定的工作表。

使用 export 函数将工作表中的数据导出到一个二维列表中。

最后,使用 Pandas 将二维列表转换成 DataFrame。

示例

假设我们有一个名为 example.xlsb 的 XLSB 文件,其包含以下内容:

| | A | B | C | |---|------|------|------| | 1 | Name | Age | City | | 2 | John | 28 | NYC | | 3 | Mary | 30 | LA | | 4 | Jack | 25 | CHI |

使用上述代码将其读取并转换成 Pandas DataFrame:

>>> print(df)
   Name  Age City
0  John   28  NYC
1  Mary   30  LA 
2  Jack   25  CHI
结束语

本文介绍了如何使用 Pyxlsb 将 XLSB 文件读取并转换成 Pandas DataFrame。读取 XLSB 与读取 XLSX 并没有太大区别,只要使用 open_workbook 函数打开相应的文件即可。