📅  最后修改于: 2023-12-03 15:38:51.003000             🧑  作者: Mango
在数据科学工作中,经常需要比较两个 Pandas 数据框中的值是否相同。本文将介绍如何比较两个 Pandas 数据框中的值。
Pandas 提供了 equals() 函数用于比较两个数据框中的值是否相同。该函数返回一个布尔值,True 表示两个数据框中的值完全相同,False 表示不同。下面是一个例子:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]}, index=['a', 'b'])
df2 = pd.DataFrame({'B': [3, 4], 'A': [1, 2]}, index=['a', 'b'])
print(df1.equals(df2)) # 输出 True
在上例中,df1 和 df2 的值是完全相同的,因此 equals() 函数返回 True。
Pandas 提供了 isin() 函数用于检查一个数据框中的元素是否在另一个数据框中。通过组合两个 isin() 函数的结果,就可以判断两个数据框中的值是否相同。下面是一个例子:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]}, index=['a', 'b'])
df2 = pd.DataFrame({'B': [3, 4], 'A': [1, 2]}, index=['a', 'b'])
result = df1.isin(df2).values.all() and df2.isin(df1).values.all()
print(result) # 输出 True
在上例中,通过 df1.isin(df2).values.all() 和 df2.isin(df1).values.all() 结合,可以得出两个数据框中的值是完全相同的。
如果两个数据框的行数和列数不完全相同,但想要比较它们中的一部分数据是否相同,那么可以按行比较。下面是一个例子:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}, index=['a', 'b', 'c'])
df2 = pd.DataFrame({'B': [4, 5, 6], 'A': [1, 2, 3]}, index=['a', 'b', 'c'])
for index, row in df1.iterrows():
if not row.equals(df2.loc[index]):
print(f"Row {index} in df1 is different from row {index} in df2")
在上例中,通过使用 iterrows() 方法分别遍历 df1 和 df2 中的每一行,并使用 equals() 函数比较这两行是否相同。如果不相同,则输出不同的行号。
本文介绍了三种方法来比较两个 Pandas 数据框中的值是否相同。这些方法包括使用 equals() 函数、使用 isin() 函数和按行比较。选择哪种方法取决于需要比较的数据框的大小、形状以及比较的精度要求。