📅  最后修改于: 2023-12-03 15:12:19.654000             🧑  作者: Mango
在 Pandas 中,可以使用 drop_duplicates()
方法来返回包含 DataFrame 中不同行的新 DataFrame。这个方法会返回不含有重复行的 DataFrame。下面是具体的用法例子:
import pandas as pd
# 创建一个包含重复行的 DataFrame
data = {'name': ['Alice', 'Bob', 'Alice'],
'age': [25, 30, 25]}
df = pd.DataFrame(data)
# 删除重复行
new_df = df.drop_duplicates()
# 输出新 DataFrame
print(new_df)
输出结果如下:
name age
0 Alice 25
1 Bob 30
这个例子中,我们首先创建了一个包含重复行的 DataFrame,然后使用 drop_duplicates()
方法来删除了重复行,最后返回了包含不同行的新 DataFrame。
除了 drop_duplicates()
方法,还有其他一些方式也可以返回 DataFrame 中不同行的新 DataFrame。例如,可以使用 groupby()
方法,将 DataFrame 按照指定列分组,然后选择每个分组中的第一行。具体的用法例子如下:
import pandas as pd
# 创建一个包含重复行的 DataFrame
data = {'name': ['Alice', 'Bob', 'Alice'],
'age': [25, 30, 25]}
df = pd.DataFrame(data)
# 按照 name 列分组,然后选择每个分组中的第一行
new_df = df.groupby('name').first().reset_index()
# 输出新 DataFrame
print(new_df)
输出结果如下:
name age
0 Alice 25
1 Bob 30
这个例子中,我们首先创建了一个包含重复行的 DataFrame,然后使用 groupby()
方法按照 name 列分组,并选择每个分组中的第一行,最后返回了包含不同行的新 DataFrame。
总之,如果你需要返回 DataFrame 中不同行的新 DataFrame,可以使用 drop_duplicates()
方法或者 groupby()
方法来实现。