📌  相关文章
📜  删除一列 pandas 中的缺失值 - Python (1)

📅  最后修改于: 2023-12-03 15:36:54.883000             🧑  作者: Mango

删除一列 pandas 中的缺失值 - Python

在 Pandas 中,处理缺失值是数据清洗过程中的一部分。有时候,您可能需要删除整个包含缺失值的列。

删除包含缺失值的列

要删除包含缺失值的列,可以使用 dropna() 函数,并设置 axis 参数为 1。下面是一个示例,删除包含缺失值的列:

import pandas as pd

# 创建一个包含缺失值的 DataFrame
df = pd.DataFrame({'A': [1, 2, 3, None, 5],
                   'B': [None, 6, 7, 8, 9],
                   'C': [10, 11, 12, 13, 14]})

# 使用 `dropna()` 函数删除包含缺失值的列
df = df.dropna(axis=1)

print(df)

输出:

   C
0  10
1  11
2  12
3  13
4  14

在这个例子中,我们创建了一个包含缺失值的 DataFrame,并使用 dropna() 函数删除了包含缺失值的列。

删除特定的列

如果您想要删除特定的列,而不是所有包含缺失值的列,那么可以使用 drop() 函数。

下面是一个示例:

import pandas as pd

# 创建一个 DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5],
                   'B': [None, 6, 7, 8, 9],
                   'C': [10, 11, 12, None, 14]})

# 删除特定的列
df = df.drop(['B', 'C'], axis=1)

print(df)

输出:

   A
0  1
1  2
2  3
3  4
4  5

在这个例子中,我们删除了 ‘B’ 和 ‘C’ 列。

结论

在 Pandas 中,可以很容易地删除包含缺失值的列。您可以使用 dropna() 函数删除所有包含缺失值的列,或者使用 drop() 函数删除特定的列。这些函数可以帮助您清洗数据,以便进行分析和建模。