📜  Pandas.fillna()(1)

📅  最后修改于: 2023-12-03 15:33:25.045000             🧑  作者: Mango

Pandas.fillna()

Pandas是一个重要的数据分析工具,在数据清洗方面具有广泛的应用。Pandas.fillna()函数是Pandas库中的一个方法,用于将缺失值或NaN值替换为指定的数据。

语法

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

参数
  • value:用于替换NaN值的标量值、字典或者Series对象。
  • method:参数值为ffillbfill,表示缺失值前向或后向填充。
  • axis:指定轴向填充,0表示按列填充,1表示按行填充。
  • inplace:True表示直接在原数据上修改,False表示返回新数据。
  • limit:指定连续缺失值填充的最大数量。
  • downcast:指定返回数据类型。
示例
import pandas as pd
import numpy as np

# 创建一个包含 NaN 值的数据框
df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8], 'C': [9, 10, 11, 12]})

# 用 0 值填充NaN值
df.fillna(0)

# 用平均值填充NaN值
df.fillna(df.mean())

# 按列用前一个非NaN值填充NaN值
df.fillna(method='ffill', axis=0)

# 按行用后一个非NaN值填充NaN值
df.fillna(method='bfill', axis=1)

# 直接在原数据上修改
df.fillna(method='ffill', inplace=True)

以上就是使用 pandas.fillna() 方法进行数据清洗的基本语法和使用示例。 使用该方法,可以更高效地处理数据集中的缺失值,提高数据分析的精度。