📜  pandas 读取 excel - Python (1)

📅  最后修改于: 2023-12-03 15:03:30.988000             🧑  作者: Mango

Pandas 读取 Excel - Python

Pandas 是一个开源的、易于使用的数据分析工具,它可以方便地读取和处理 Excel 数据。在本文中,我们将介绍如何使用 Pandas 读取 Excel 文件。

安装 Pandas

在开始之前,您需要先安装 Pandas。您可以使用以下命令来安装:

pip install pandas
读取 Excel 文件

使用 Pandas 读取 Excel 文件非常简单。下面是一个基本的示例:

import pandas as pd

# 读取 Excel 文件
df = pd.read_excel("data.xlsx")

# 打印前 5 行数据
print(df.head())

在上面的代码中,我们首先导入 Pandas 库,然后使用 pd.read_excel 函数读取 Excel 文件。这个函数的参数为 Excel 文件的路径。读取之后,我们可以使用 head() 方法打印前面几行数据。

读取多个工作表

如果 Excel 文件中有多个工作表,我们可以使用 Pandas 来读取它们。下面是一个示例:

import pandas as pd

# 读取多个工作表
dfs = pd.read_excel("data.xlsx", sheet_name=["Sheet1", "Sheet2"])

# 打印第一个工作表的前 5 行数据
print(dfs["Sheet1"].head())

# 打印第二个工作表的前 5 行数据
print(dfs["Sheet2"].head())

在上面的代码中,我们使用 sheet_name 参数来指定要读取的工作表。此参数可以是工作表的名称或索引。

读取指定的行和列

有时,我们可能只需要读取 Excel 文件中的特定行和列。这时,我们可以使用 Pandas 的 read_excel 函数的 usecolsnrows 参数。下面是一个示例:

import pandas as pd

# 读取指定的行和列
df = pd.read_excel("data.xlsx", usecols="A:C,E", nrows=10)

# 打印前 10 行数据
print(df.head(10))

在上面的代码中,我们使用 usecols 参数来指定要读取的列。此参数可以是列的名称或索引。我们还使用 nrows 参数来指定要读取的行数。

导出数据到 Excel 文件

除了读取 Excel 文件,Pandas 还提供了一种将数据导出到 Excel 文件的方法。下面是一个示例:

import pandas as pd

# 创建数据帧
df = pd.DataFrame({
    "Name": ["Alice", "Bob", "Charlie", "Dave"],
    "Age": [25, 30, 35, 40],
    "Salary": [50000, 60000, 70000, 80000]
})

# 导出数据到 Excel 文件
df.to_excel("output.xlsx", index=False)

在上面的代码中,我们首先创建了一个数据帧,然后使用 to_excel 方法将数据导出到 Excel 文件。此方法的第一个参数为要保存的文件路径。如果您不想在 Excel 文件中包含索引,请将 index 参数设置为 False。

总结

在本文中,我们介绍了如何使用 Pandas 来读取和导出 Excel 文件。Pandas 是一个非常强大的数据分析工具,它可以帮助您快速处理 Excel 数据。如果您想了解更多关于 Pandas 的信息,请访问官方文档。