📜  Pandas 读取 excel (1)

📅  最后修改于: 2023-12-03 15:18:15.538000             🧑  作者: Mango

Pandas 读取 Excel 文件

Pandas 是 Python 中一个非常流行的数据分析库。其中,它具有读取 Excel 文件的能力,方便我们进行数据处理和分析。

安装 Pandas

如果您已经安装了 pip 包管理器,那么安装 Pandas 可以通过以下命令来实现:

pip install pandas

如果您使用的是 Conda 包管理器,则可以通过以下命令安装 Pandas:

conda install pandas
读取 Excel 文件

在 Pandas 中,可以使用 read_excel() 方法来读取 Excel 文件。以下是一个示例:

import pandas as pd

df = pd.read_excel('example.xlsx')
print(df)

输出:

   Name  Age
0   Tom   20
1  Jack   25
2   Liz   22

您可以看到,我们成功读取了名为 example.xlsx 的 Excel 文件,并将其转换为一个 Pandas DataFrame。

读取特定的工作表

如果 Excel 文件中存在多个工作表,我们可以使用 sheet_name 参数来指定需要读取的工作表。以下是一个示例:

import pandas as pd

df = pd.read_excel('example.xlsx', sheet_name='Sheet2')
print(df)

输出:

    Color  Price
0     Red      5
1  Yellow      7
2    Blue      6
自动检测标题行

默认情况下,Pandas 会自动检测 Excel 文件的标题行。这意味着 Pandas 会将第一行作为列名,并跳过第一行之后的所有数据。以下是一个示例:

import pandas as pd

df = pd.read_excel('example.xlsx')
print(df)

输出:

   Name  Age
0   Tom   20
1  Jack   25
2   Liz   22

如果你的 Excel 文件没有标题行,你可以使用 header=None 参数来跳过标题行。以下是一个示例:

import pandas as pd

df = pd.read_excel('example.xlsx', header=None)
print(df)

输出:

       0    1
0   Name  Age
1    Tom   20
2   Jack   25
3    Liz   22
跳过特定的行

有时候,Excel 文件的前几行并不是我们需要的数据。这时候,我们可以使用 skiprows 参数来跳过这些行。以下是一个示例:

import pandas as pd

df = pd.read_excel('example.xlsx', skiprows=2)
print(df)

输出:

    Liz  22
0  John  24
1   Bob  19

您可以看到,我们成功跳过了前两行,并读取了剩余的数据。

读取特定的列

如果您只需要读取 Excel 文件中的特定列,您可以使用 usecols 参数来指定这些列。以下是一个示例:

import pandas as pd

df = pd.read_excel('example.xlsx', usecols=['Name'])
print(df)

输出:

   Name
0   Tom
1  Jack
2   Liz
3  John
4   Bob

如果您需要读取多个列,则可以将这些列的名称作为一个列表传递给 usecols 参数。例如:

import pandas as pd

df = pd.read_excel('example.xlsx', usecols=['Name', 'Age'])
print(df)

输出:

   Name  Age
0   Tom   20
1  Jack   25
2   Liz   22
3  John   24
4   Bob   19
总结

在本文中,我们已经学习了如何使用 Pandas 读取 Excel 文件。我们已经学习了如何读取特定的工作表、如何自动检测标题行、如何跳过特定的行、如何读取特定的列等等。Pandas 提供了更多的参数和功能,以帮助您更好地处理 Excel 中的数据。