📌  相关文章
📜  jupyter notebook 中的 df.fillna("tagline",inplace=True) - Python (1)

📅  最后修改于: 2023-12-03 14:43:37.282000             🧑  作者: Mango

Jupyter Notebook 中的 df.fillna() 函数介绍

在数据分析中,经常会遇到缺失值的情况,而 Pandas 提供了丰富的处理缺失值的函数。其中,df.fillna() 函数就是一种常用的填充缺失值的方法。

函数介绍

df.fillna() 函数可以将 DataFrame 中的缺失值(NaN 或 None)替换为用户指定的值。函数的语法如下:

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

其中,参数的含义如下:

  • value:用于填充缺失值的标量或字典对象。
  • method:用于填充缺失值的方法。可选参数为 'backfill'、'bfill'、'pad'、'ffill'。
  • axis:要填充缺失值的轴。可选参数 'index'、'columns'。
  • inplace:是否将填充的结果写入原 DataFrame 中。默认为 False。
  • limit:在前向或后向填充时的最大连续填充数。
  • downcast:如果可能,将 DataFrame 中所有列的数据类型下降为比当前 dtype 更紧凑的类型。
使用示例

下面是一个简单的使用示例,假设我们有一个 DataFrame,其中含有一些缺失值:

import pandas as pd
import numpy as np

df = pd.DataFrame({
    'A': [1, 2, np.nan, 4],
    'B': [5, np.nan, 7, np.nan],
    'C': [np.nan, 8, 9, 10],
    'D': [11, 12, 13, 14]
})

我们可以使用 df.fillna() 函数将缺失值填充为一个指定的值(比如0):

df.fillna(0, inplace=True)

我们也可以使用 method 参数指定填充方法,比如使用前向填充:

df.fillna(method='ffill', inplace=True)

更多使用示例请参见 Pandas 文档。