📅  最后修改于: 2023-12-03 15:36:14.658000             🧑  作者: Mango
Pandas 是一个非常流行的 Python 数据分析库, pandas 拥有很多的数据处理功能, 本文主要介绍如何从 pandas 列中清除 nas。
在 Pandas 中,NaN(Not A Number) 或 None 通常称为 null 值,缺失值通常标识为 NA(Not Available)。
在 Pandas 中清除 nas 有两种方法:
df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
示例代码:
import pandas as pd
data = {'A': [1, 2, 3, None, 5], 'B': [6, 7, 8, None, 10], 'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
print(df)
print(df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False))
输出结果:
A B C
0 1.0 6.0 11
1 2.0 7.0 12
2 3.0 8.0 13
3 NaN NaN 14
4 5.0 10.0 15
A B C
0 1.0 6.0 11
1 2.0 7.0 12
2 3.0 8.0 13
4 5.0 10.0 15
df.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)
示例代码:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, np.nan, 8], 'C': ['a', 'b', np.nan, 'c']})
print(df.fillna(value=0))
输出结果:
A B C
0 1.0 5.0 a
1 2.0 0.0 b
2 0.0 0.0 0
3 4.0 8.0 c
以上就是从 pandas 列中清除 nas 的两种方法,其中 dropna() 方法是删除包含 NaN 或 None 值的行或列,fillna() 方法是将缺失值填充为特定值。两种方法根据不同的数据处理需求,选择相应的算法即可。