📌  相关文章
📜  使用Python Pandas 连接来自多个文件的 Excel 数据(1)

📅  最后修改于: 2023-12-03 15:06:52.976000             🧑  作者: Mango

使用Python Pandas 连接来自多个文件的 Excel 数据

在实际数据分析和处理中,我们经常需要从多个Excel文件中读取数据进行分析或者合并。Python中的Pandas库可以帮助我们高效地完成这个任务。

1. 安装Pandas

使用Pandas前,需要先进行安装。可以使用以下命令进行安装:

!pip install pandas
2. 基本读取Excel数据

使用Pandas读取Excel文件非常简单,只需要使用read_excel函数。例如,以下代码可以读取名为example.xlsx的Excel文件中名为Sheet1的表格:

import pandas as pd

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
print(df.head())

其中的sheet_name参数可以用来指定读取的表格名称或者表格索引。如果不指定,则默认读取第一个表格。从read_excel函数返回的是一个Pandas的DataFrame类型的数据,可以使用head函数来显示前几行数据。

3. 连接多个Excel文件
3.1. 连接两个Excel文件

以下代码演示了如何连接两个Excel文件。我们将读取两个文件中的数据,并将它们合并起来。首先是第一个Excel文件file1.xlsx

df1 = pd.read_excel('file1.xlsx', sheet_name='Sheet1')
print(df1.head())

其次是第二个Excel文件file2.xlsx

df2 = pd.read_excel('file2.xlsx', sheet_name='Sheet1')
print(df2.head())

接下来,我们可以使用concat函数将两个DataFrame合并起来:

df = pd.concat([df1, df2])
print(df.head())

其中,concat函数的第一个参数传入一个列表,其中包含需要合并的DataFrame数据。在这个例子中,我们将两个DataFrame传入,使用列表的形式进行了合并。

3.2. 连接多个Excel文件

如果需要连接多个Excel文件,则可以使用循环的方式来逐个连接。以下代码演示了如何连接三个Excel文件:

df_list = []

for i in range(1, 4):
    df = pd.read_excel(f'file{i}.xlsx', sheet_name='Sheet1')
    df_list.append(df)
    
df = pd.concat(df_list)
print(df.head())

这里使用了循环,将读取的三个Excel文件的DataFrame对象存入列表中,然后使用concat函数合并起来。

4. 总结

本文介绍了如何使用Python Pandas库连接来自多个Excel文件的数据。通过学习本文,您可以掌握基本的Excel数据读取和连接方法。Pandas提供了众多数据处理相关的函数和类,非常适合进行数据分析和处理的任务。