📅  最后修改于: 2023-12-03 15:10:03.400000             🧑  作者: Mango
在Python中,我们可以使用pandas
库来执行表操作。其中,左外连接是一种常用的操作,可以用来将两个表格连接在一起。下面是一个演示如何执行 self 和 other 的左外连接的代码示例。
import pandas as pd
首先,我们需要准备两个数据表格: self 和 other。
self = pd.DataFrame({'key': [1, 2, 3, 4], 'value': ['foo', 'bar', 'baz', 'qux']})
other = pd.DataFrame({'key': [3, 4, 5, 6], 'value': ['spam', 'ham', 'eggs', 'bacon']})
这里,我们创建了两个DataFrame: self 和 other。它们分别包含两列数据,其中一列是key
,一列是value
。我们可以看到,self 中包含了键为1、2、3、4的四个数据行;而other 则包含了键为3、4、5、6的四个数据行。这两个表格中都有键为3和4的行,其中 self 的3行和4行的value
列是baz
和qux
,而other的3行和4行的value
列是spam
和ham
。
我们可以使用 pandas
库的merge
函数来执行左外连接。下面是示例代码:
result = pd.merge(self, other, on='key', how='left')
这里,我们使用了merge
函数来创建了一个新的表格result
。我们将 self 和 other 作为函数的第一个和第二个参数,分别表示要连接的两个表格。参数on
表示连接的键列,这里使用了key
作为键。参数how
表示连接的方式,这里使用了左外连接。
我们将result
可视化输出,查看左外连接的结果。
print(result)
输出结果如下:
key value_x value_y
0 1 foo NaN
1 2 bar NaN
2 3 baz spam
3 4 qux ham
我们可以看到,result
包含了三列数据,其中key
列和value_x
列是来自self表格的数据,而value_y
列是来自other表格的数据。我们可以看到,连接之后的结果中,键为1和2的行在other表格中没有对应的数据,因此value_y
列填充了NaN
值;而键为3和4的行,则分别与other表格中键为3和4的行匹配上了,所以value_y
列填充了对应的值。