📌  相关文章
📜  使用Python Pandas 连接来自多个文件的 Excel 数据

📅  最后修改于: 2022-05-13 01:54:50.312000             🧑  作者: Mango

使用Python Pandas 连接来自多个文件的 Excel 数据

让我们看看如何合并两个excel文件的数据,并将合并后的数据保存为一个新的Excel文件。

我们有 2 个文件, registration details.xlsxexam results.xlsx

registration details.xlsx

我们在此文件中有 7 列,其中包含 14 个独特的学生详细信息。列名如下:

  • 入学日期
  • 学生的名字
  • 性别
  • 出生日期
  • 学生电子邮件 ID
  • 查询编号
  • 注册号码。

exam results.xlsx

我们在此文件中有 7 列,其中包含 32 个独特的学生详细信息。列名如下:

  • 注册号码。
  • 姓名
  • 尝试的问题数
  • 正确的
  • 不正确
  • 获得的分数
  • 百分比

您可以从以下链接下载这些文件:registration details.xlsx 和 Exam results.xlsx。

现在,让我们看看这两个文件之间的公共列:

所以 excel 文件之间的共同列是REGISTRATION NO 。所以我们需要合并这两个文件,使新的 excel 文件只包含所需的列,即:

算法 :

  1. 导入 Pandas 模块。
  2. 使用read_excel()函数读取这两个文件。
  3. 使用merge()函数将它们组合起来。
  4. 使用to_excel()函数来创建结果文件。
# importing the module
import pandas
  
# reading the files
f1 = pandas.read_excel("registration details.xlsx")
f2 = pandas.read_excel("exam results.xlsx")
  
# merging the files
f3 = f1[["REGISTRATION NO", 
         "STUDENT EMAIL ID "]].merge(f2[["REGISTRATION NO", 
                                         "Name", "Marks Obtained", 
                                         "Percentage"]], 
                                     on = "REGISTRATION NO", 
                                     how = "left")
  
# creating a new file
f3.to_excel("Results.xlsx", index = False)

输出 :