📅  最后修改于: 2023-12-03 15:38:56.353000             🧑  作者: Mango
在数据处理中,经常需要将两个数据框按照其中的某些列进行连接,以便进行后续的分析。在Python中,可以使用pandas
库来实现这一目的。本文将介绍如何通过2列连接两个数据框,以便它们只有公共行。
首先,我们需要准备两个数据框,分别为df1
和df2
。这里我们使用pandas
库自带的数据框来演示。
import pandas as pd
# 导入数据框
df1 = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv')
df2 = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv')
在pandas
中,可以使用merge
函数按照某些列将两个数据框连接在一起。为了只保留公共行,我们需要设置how
参数为inner
。
# 按照species和sex两列连接数据框
result = pd.merge(df1, df2, on=['species', 'sex'], how='inner')
最后,我们可以查看连接后的数据框result
,以便检查是否只包含公共行。
# 查看连接后的数据框
print(result)
以上就是如何通过2列连接两个数据框,以便它们只有公共行的方法。如果你有其他的数据处理问题,可以参考pandas
库的官方文档,里面包含了更多的数据处理技巧和示例。