📜  返回包含此 DataFrame 中不同行的新 DataFrame - Python (1)

📅  最后修改于: 2023-12-03 15:12:19.654000             🧑  作者: Mango

返回包含此 DataFrame 中不同行的新 DataFrame - Python

在 Pandas 中,可以使用 drop_duplicates() 方法来返回包含 DataFrame 中不同行的新 DataFrame。这个方法会返回不含有重复行的 DataFrame。下面是具体的用法例子:

import pandas as pd

# 创建一个包含重复行的 DataFrame
data = {'name': ['Alice', 'Bob', 'Alice'],
        'age': [25, 30, 25]}
df = pd.DataFrame(data)

# 删除重复行
new_df = df.drop_duplicates()

# 输出新 DataFrame
print(new_df)

输出结果如下:

    name  age
0  Alice   25
1    Bob   30

这个例子中,我们首先创建了一个包含重复行的 DataFrame,然后使用 drop_duplicates() 方法来删除了重复行,最后返回了包含不同行的新 DataFrame。

除了 drop_duplicates() 方法,还有其他一些方式也可以返回 DataFrame 中不同行的新 DataFrame。例如,可以使用 groupby() 方法,将 DataFrame 按照指定列分组,然后选择每个分组中的第一行。具体的用法例子如下:

import pandas as pd

# 创建一个包含重复行的 DataFrame
data = {'name': ['Alice', 'Bob', 'Alice'],
        'age': [25, 30, 25]}
df = pd.DataFrame(data)

# 按照 name 列分组,然后选择每个分组中的第一行
new_df = df.groupby('name').first().reset_index()

# 输出新 DataFrame
print(new_df)

输出结果如下:

    name  age
0  Alice   25
1    Bob   30

这个例子中,我们首先创建了一个包含重复行的 DataFrame,然后使用 groupby() 方法按照 name 列分组,并选择每个分组中的第一行,最后返回了包含不同行的新 DataFrame。

总之,如果你需要返回 DataFrame 中不同行的新 DataFrame,可以使用 drop_duplicates() 方法或者 groupby() 方法来实现。