📅  最后修改于: 2023-12-03 15:33:25.045000             🧑  作者: Mango
Pandas是一个重要的数据分析工具,在数据清洗方面具有广泛的应用。Pandas.fillna()函数是Pandas库中的一个方法,用于将缺失值或NaN值替换为指定的数据。
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)
value
:用于替换NaN值的标量值、字典或者Series对象。method
:参数值为ffill
或bfill
,表示缺失值前向或后向填充。axis
:指定轴向填充,0表示按列填充,1表示按行填充。inplace
:True表示直接在原数据上修改,False表示返回新数据。limit
:指定连续缺失值填充的最大数量。downcast
:指定返回数据类型。import pandas as pd
import numpy as np
# 创建一个包含 NaN 值的数据框
df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8], 'C': [9, 10, 11, 12]})
# 用 0 值填充NaN值
df.fillna(0)
# 用平均值填充NaN值
df.fillna(df.mean())
# 按列用前一个非NaN值填充NaN值
df.fillna(method='ffill', axis=0)
# 按行用后一个非NaN值填充NaN值
df.fillna(method='bfill', axis=1)
# 直接在原数据上修改
df.fillna(method='ffill', inplace=True)
以上就是使用 pandas.fillna() 方法进行数据清洗的基本语法和使用示例。 使用该方法,可以更高效地处理数据集中的缺失值,提高数据分析的精度。