📅  最后修改于: 2023-12-03 14:49:39.139000             🧑  作者: Mango
在数据分析与处理中,常常需要将 Excel 文件中的数据导入到程序中进行进一步的处理与分析。Python 中有很多库可以帮助我们完成这个任务,其中就包括 pandas,它是 Python 中用于数据处理的常用库之一。
pandas 提供了一个函数 read_excel(),它可以读取 Excel 文件,并将数据转化为数据框(DataFrame)的形式。下面我们将介绍如何使用 pandas 中的 read_excel() 函数,从 Excel 文件创建数据框。
在使用 pandas 之前,我们需要先安装它。我们可以使用 Python 的包管理器 pip 来进行安装。在命令行中输入以下命令:
pip install pandas
如果你使用的是 Conda,也可以使用以下命令进行安装:
conda install pandas
假设我们有一个 Excel 文件叫做 'data.xlsx',其中包含一个名为 'Sheet1' 的工作表。在这个工作表中,我们有以下数据:
| | Name | Age | Gender | Salary | | - | ---- | --- | ------ | ------ | | 0 | John | 25 | Male | 5000 | | 1 | Jane | 30 | Female | 6000 | | 2 | Bob | 35 | Male | 7000 |
下面的代码可以用来读取这个 Excel 文件,并将数据转化为数据框的形式:
import pandas as pd
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
print(df)
输出结果为:
Name Age Gender Salary
0 John 25 Male 5000
1 Jane 30 Female 6000
2 Bob 35 Male 7000
在这个例子中,我们使用了 pd.read_excel() 函数来读取 Excel 文件 'data.xlsx' 中的 'Sheet1' 工作表,并将结果存储到一个名为 df 的数据框中。我们还使用了 print() 函数来打印数据框的内容。
read_excel() 函数还有很多其他的参数可以使用,例如:
详细参数说明可以查看 pandas 文档。
使用 pandas 中的 read_excel() 函数,可以轻松地从 Excel 文件中读取数据并创建数据框。我们可以使用其他参数来控制读取的方式。在进行数据分析与处理时,这是一个非常有用的工具。