📜  Python|熊猫索引.fillna()(1)

📅  最后修改于: 2023-12-03 15:19:22.057000             🧑  作者: Mango

Python | 熊猫索引fillna()

介绍

fillna()pandas库中的一种方法,用于填充数据中的缺失值。索引fillna()方法可以将多个列中的某些列中的缺失值进行填充。 这个方法可以很容易地用于缺失值或任何其他类型的缺失数据的处理工作。

语法

索引的fillna()方法的语法如下所示:

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)
参数
  • value:要用来填充缺失值的某个值或值的字典。
  • method:要使用的插值方法。它有多种可用的值,如ffillbfill等。默认为None,该方法会将所有现有值替换为None
  • axis:指定要填充的轴。默认是0,表示填充行,1表示填充列。
  • inplace:指定fillna()方法是不是可以修改原始数据,如果在原始数据上进行修改,则为True,否则为False
  • limit:对于向前或向后填充中要填充的缺失值的最大数量。
  • downcast:将数据降低到较小的数据类型以减少内存使用。默认为None
返回值

fillna()方法的返回值是填充了缺失值的数据集。

代码示例
填充缺失值为0
import pandas as pd

data = {'Name': ['Tom', 'Jerry', 'Micky', 'Minnie', 'Donald', 'Daisy'],
        'Age': [20, None, 15, None, 25, 30],
        'Gender': ['M', None, 'M', None, 'M', 'F']}
df = pd.DataFrame(data)

print("原始数据为:\n", df)

df.fillna(value=0, inplace=True)

print("\n修改后的数据为:\n", df)

输出结果如下:

原始数据为:
      Name   Age Gender
0     Tom  20.0      M
1   Jerry   NaN   None
2   Micky  15.0      M
3  Minnie   NaN   None
4  Donald  25.0      M
5   Daisy  30.0      F

修改后的数据为:
      Name   Age Gender
0     Tom  20.0      M
1   Jerry   0.0      0
2   Micky  15.0      M
3  Minnie   0.0      0
4  Donald  25.0      M
5   Daisy  30.0      F

此示例中,我们使用fillna()方法将数据集中的所有缺失值替换为0

填充缺失值为前一个非缺失值
import pandas as pd

data = {'Name': ['Tom', 'Jerry', 'Micky', 'Minnie', 'Donald', 'Daisy'],
        'Age': [20, None, 15, None, 25, 30],
        'Gender': ['M', None, 'M', None, 'M', 'F']}
df = pd.DataFrame(data)

print("原始数据为:\n", df)

df.fillna(method='ffill', inplace=True)

print("\n修改后的数据为:\n", df)

输出结果如下:

原始数据为:
      Name   Age Gender
0     Tom  20.0      M
1   Jerry   NaN   None
2   Micky  15.0      M
3  Minnie   NaN   None
4  Donald  25.0      M
5   Daisy  30.0      F

修改后的数据为:
      Name   Age Gender
0     Tom  20.0      M
1   Jerry  20.0      M
2   Micky  15.0      M
3  Minnie  15.0      M
4  Donald  25.0      M
5   Daisy  30.0      F

此示例中,我们使用fillna()方法将数据集中的缺失值用前一个非缺失值进行填充。

总结

fillna()方法是一个简单而实用的pandas函数,可用于处理缺失数据的工作。 在数据处理中,数据可能会包含大量的空格,这时就需要使用fillna()方法来对这些空格进行处理。