📜  Pandas 中两个数据框的交集 – Python(1)

📅  最后修改于: 2023-12-03 15:03:28.930000             🧑  作者: Mango

Pandas 中两个数据框的交集 – Python

在 Pandas 中,使用 merge() 方法可以实现两个数据框之间的连接,一般默认是按照列名相同的列进行连接。如果需要进行交集操作,可以使用 merge() 方法结合 how='inner' 参数实现。

准备数据

首先,我们需要准备两个数据框,方便进行示例演示。

import pandas as pd

# 准备数据集 df1
df1 = pd.DataFrame({
    'A': ['A0', 'A1', 'A2', 'A3'],
    'B': ['B0', 'B1', 'B2', 'B3'],
    'C': ['C0', 'C1', 'C2', 'C3'],
    'D': ['D0', 'D1', 'D2', 'D3']
})
print("df1 数据集:")
print(df1)

# 准备数据集 df2
df2 = pd.DataFrame({
    'A': ['A2', 'A3', 'A4', 'A5'],
    'B': ['B2', 'B3', 'B4', 'B5'],
    'C': ['C2', 'C3', 'C4', 'C5'],
    'D': ['D2', 'D3', 'D4', 'D5']
})
print("\ndf2 数据集:")
print(df2)

执行结果如下:

df1 数据集:
    A   B   C   D
0  A0  B0  C0  D0
1  A1  B1  C1  D1
2  A2  B2  C2  D2
3  A3  B3  C3  D3

df2 数据集:
    A   B   C   D
0  A2  B2  C2  D2
1  A3  B3  C3  D3
2  A4  B4  C4  D4
3  A5  B5  C5  D5
数据集的交集

接下来,我们使用 merge() 方法,结合 how='inner' 参数实现两个数据集的交集。

# 合并 df1 和 df2,得到两个数据集的交集
df_inter = pd.merge(df1, df2, how='inner')
print("\n数据集的交集为:")
print(df_inter)

执行结果如下:

数据集的交集为:
    A   B   C   D
0  A2  B2  C2  D2
1  A3  B3  C3  D3

可以看出,两个数据集的交集是由 A2、A3 两行数据组成。

结语

通过本文的介绍,我们可以了解到 Pandas 中两个数据框的交集如何实现。 merge() 方法还可以根据不同的需求选择 how 参数,实现不同的连接方式。