📜  Python|熊猫系列.fillna()(1)

📅  最后修改于: 2023-12-03 15:34:20.659000             🧑  作者: Mango

Python熊猫系列——fillna()

简介

fillna()是pandas库中的一个函数,用于填充缺失值。缺失值一般用NaN来表示。函数可以接收不同的填充值作为参数,如0,平均值、前一个或后一个有效值等。

参数
  • value:用于填充缺失值的标量、字典、Series或DataFrame
  • method:fill(或pad)表示向前填充、bfill(或backfill)表示向后填充
  • axis:0代表按列进行填充,即纵向填充;1代表按行进行填充,即横向填充
  • inplace:直接修改原数据,而不是返回新的DataFrame
示例

下面的示例,我们首先创建一个DataFrame对象,有些元素是缺失的,然后使用fillna()函数来填充这些缺失值。

import pandas as pd
import numpy as np

df = pd.DataFrame({'A': [1, 2, np.nan], 'B': [4, np.nan, np.nan], 'C': [7, 8, 9]})
print(df)

输出结果:

     A    B  C
0  1.0  4.0  7
1  2.0  NaN  8
2  NaN  NaN  9
用0填充
fill_0 = df.fillna(0)
print(fill_0)

输出结果:

     A    B  C
0  1.0  4.0  7
1  2.0  0.0  8
2  0.0  0.0  9
用上一个值填充
fill_ffill = df.fillna(method='ffill')
print(fill_ffill)

输出结果:

     A    B  C
0  1.0  4.0  7
1  2.0  4.0  8
2  2.0  4.0  9
用平均值填充
fill_mean = df.fillna(value=df.mean())
print(fill_mean)

输出结果:

     A    B  C
0  1.0  4.0  7
1  2.0  4.0  8
2  1.5  4.0  9
总结

fillna()函数是pandas库中非常实用的函数,让我们可以轻松地处理数据中的缺失值。fillna()的方法会根据参数的设定而进行相应的操作。我们可以用一个可靠的方法来填充数据,这将有助于我们得到更好的结果。