📅  最后修改于: 2023-12-03 14:43:37.282000             🧑  作者: Mango
在数据分析中,经常会遇到缺失值的情况,而 Pandas 提供了丰富的处理缺失值的函数。其中,df.fillna() 函数就是一种常用的填充缺失值的方法。
df.fillna() 函数可以将 DataFrame 中的缺失值(NaN 或 None)替换为用户指定的值。函数的语法如下:
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)
其中,参数的含义如下:
value
:用于填充缺失值的标量或字典对象。method
:用于填充缺失值的方法。可选参数为 'backfill'、'bfill'、'pad'、'ffill'。axis
:要填充缺失值的轴。可选参数 'index'、'columns'。inplace
:是否将填充的结果写入原 DataFrame 中。默认为 False。limit
:在前向或后向填充时的最大连续填充数。downcast
:如果可能,将 DataFrame 中所有列的数据类型下降为比当前 dtype 更紧凑的类型。下面是一个简单的使用示例,假设我们有一个 DataFrame,其中含有一些缺失值:
import pandas as pd
import numpy as np
df = pd.DataFrame({
'A': [1, 2, np.nan, 4],
'B': [5, np.nan, 7, np.nan],
'C': [np.nan, 8, 9, 10],
'D': [11, 12, 13, 14]
})
我们可以使用 df.fillna() 函数将缺失值填充为一个指定的值(比如0):
df.fillna(0, inplace=True)
我们也可以使用 method 参数指定填充方法,比如使用前向填充:
df.fillna(method='ffill', inplace=True)
更多使用示例请参见 Pandas 文档。