使用Python Pandas 连接来自多个文件的 Excel 数据
让我们看看如何合并两个excel文件的数据,并将合并后的数据保存为一个新的Excel文件。
我们有 2 个文件, registration details.xlsx
和exam results.xlsx
。
registration details.xlsx
我们在此文件中有 7 列,其中包含 14 个独特的学生详细信息。列名如下:
- 入学日期
- 学生的名字
- 性别
- 出生日期
- 学生电子邮件 ID
- 查询编号
- 注册号码。
exam results.xlsx
我们在此文件中有 7 列,其中包含 32 个独特的学生详细信息。列名如下:
- 注册号码。
- 姓名
- 尝试的问题数
- 正确的
- 不正确
- 获得的分数
- 百分比
您可以从以下链接下载这些文件:registration details.xlsx 和 Exam results.xlsx。
现在,让我们看看这两个文件之间的公共列:
所以 excel 文件之间的共同列是REGISTRATION NO 。所以我们需要合并这两个文件,使新的 excel 文件只包含所需的列,即:
算法 :
- 导入 Pandas 模块。
- 使用
read_excel()
函数读取这两个文件。 - 使用
merge()
函数将它们组合起来。 - 使用
to_excel()
函数来创建结果文件。
# importing the module
import pandas
# reading the files
f1 = pandas.read_excel("registration details.xlsx")
f2 = pandas.read_excel("exam results.xlsx")
# merging the files
f3 = f1[["REGISTRATION NO",
"STUDENT EMAIL ID "]].merge(f2[["REGISTRATION NO",
"Name", "Marks Obtained",
"Percentage"]],
on = "REGISTRATION NO",
how = "left")
# creating a new file
f3.to_excel("Results.xlsx", index = False)
输出 :
在评论中写代码?请使用 ide.geeksforgeeks.org,生成链接并在此处分享链接。