📜  使用 Excel 文件创建数据框(1)

📅  最后修改于: 2023-12-03 14:49:39.139000             🧑  作者: Mango

使用 Excel 文件创建数据框

在数据分析与处理中,常常需要将 Excel 文件中的数据导入到程序中进行进一步的处理与分析。Python 中有很多库可以帮助我们完成这个任务,其中就包括 pandas,它是 Python 中用于数据处理的常用库之一。

pandas 提供了一个函数 read_excel(),它可以读取 Excel 文件,并将数据转化为数据框(DataFrame)的形式。下面我们将介绍如何使用 pandas 中的 read_excel() 函数,从 Excel 文件创建数据框。

安装 pandas 库

在使用 pandas 之前,我们需要先安装它。我们可以使用 Python 的包管理器 pip 来进行安装。在命令行中输入以下命令:

pip install pandas

如果你使用的是 Conda,也可以使用以下命令进行安装:

conda install pandas
读取 Excel 文件并创建数据框

假设我们有一个 Excel 文件叫做 'data.xlsx',其中包含一个名为 'Sheet1' 的工作表。在这个工作表中,我们有以下数据:

| | Name | Age | Gender | Salary | | - | ---- | --- | ------ | ------ | | 0 | John | 25 | Male | 5000 | | 1 | Jane | 30 | Female | 6000 | | 2 | Bob | 35 | Male | 7000 |

下面的代码可以用来读取这个 Excel 文件,并将数据转化为数据框的形式:

import pandas as pd

df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
print(df)

输出结果为:

   Name  Age  Gender  Salary
0  John   25    Male    5000
1  Jane   30  Female    6000
2   Bob   35    Male    7000

在这个例子中,我们使用了 pd.read_excel() 函数来读取 Excel 文件 'data.xlsx' 中的 'Sheet1' 工作表,并将结果存储到一个名为 df 的数据框中。我们还使用了 print() 函数来打印数据框的内容。

其他参数

read_excel() 函数还有很多其他的参数可以使用,例如:

  • header:指定哪一行作为列名。默认为第一行。
  • skiprows:指定要跳过的行数。可以是一个整数或一个列表。
  • usecols:指定要读取的列数。可以是一个整数或一个列表。
  • nrows:指定要读取的行数。默认情况下,读取整个工作表。

详细参数说明可以查看 pandas 文档。

总结

使用 pandas 中的 read_excel() 函数,可以轻松地从 Excel 文件中读取数据并创建数据框。我们可以使用其他参数来控制读取的方式。在进行数据分析与处理时,这是一个非常有用的工具。