📜  python - 删除 df 中重复的列 - Python (1)

📅  最后修改于: 2023-12-03 15:04:02.853000             🧑  作者: Mango

Python - 删除 df 中重复的列

在 Pandas 中,我们经常需要处理具有重复列的数据框(df)。有时,这些重复列没有影响,但通常会导致数据分析和可视化过程中的问题。因此,删除 df 中的重复列是一个非常有用的技能。

下面是一个简单的 Python 代码片段,通过 Pandas 库中的 drop_duplicates() 方法,删除了 df 中的重复列。

import pandas as pd

# 创建一个包含重复列的示例 df
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9], 'A': [10, 11, 12]})

print("原始 df:")
print(df)

# 删除重复列
df = df.loc[:,~df.columns.duplicated()]

print("删除重复列后的 df:")
print(df)

输出:

原始 df:
    A  B  C
0  10  4  7
1  11  5  8
2  12  6  9
删除重复列后的 df:
    A  B  C
0  10  4  7
1  11  5  8
2  12  6  9

这段代码使用 Pandas 库中的 loc() 方法,以及 Python 中的 ~ 操作符(按位取反),删除了 df 中的重复列。

以上是如何在 Pandas 中删除 df 中重复列的简单示例。此方法适用于所有版本的 Pandas。