📅  最后修改于: 2023-12-03 15:03:28.930000             🧑  作者: Mango
在 Pandas 中,使用 merge()
方法可以实现两个数据框之间的连接,一般默认是按照列名相同的列进行连接。如果需要进行交集操作,可以使用 merge()
方法结合 how='inner'
参数实现。
首先,我们需要准备两个数据框,方便进行示例演示。
import pandas as pd
# 准备数据集 df1
df1 = pd.DataFrame({
'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']
})
print("df1 数据集:")
print(df1)
# 准备数据集 df2
df2 = pd.DataFrame({
'A': ['A2', 'A3', 'A4', 'A5'],
'B': ['B2', 'B3', 'B4', 'B5'],
'C': ['C2', 'C3', 'C4', 'C5'],
'D': ['D2', 'D3', 'D4', 'D5']
})
print("\ndf2 数据集:")
print(df2)
执行结果如下:
df1 数据集:
A B C D
0 A0 B0 C0 D0
1 A1 B1 C1 D1
2 A2 B2 C2 D2
3 A3 B3 C3 D3
df2 数据集:
A B C D
0 A2 B2 C2 D2
1 A3 B3 C3 D3
2 A4 B4 C4 D4
3 A5 B5 C5 D5
接下来,我们使用 merge()
方法,结合 how='inner'
参数实现两个数据集的交集。
# 合并 df1 和 df2,得到两个数据集的交集
df_inter = pd.merge(df1, df2, how='inner')
print("\n数据集的交集为:")
print(df_inter)
执行结果如下:
数据集的交集为:
A B C D
0 A2 B2 C2 D2
1 A3 B3 C3 D3
可以看出,两个数据集的交集是由 A2、A3 两行数据组成。
通过本文的介绍,我们可以了解到 Pandas 中两个数据框的交集如何实现。 merge()
方法还可以根据不同的需求选择 how
参数,实现不同的连接方式。