📅  最后修改于: 2023-12-03 15:19:22.057000             🧑  作者: Mango
fillna()
是pandas
库中的一种方法,用于填充数据中的缺失值。索引fillna()
方法可以将多个列中的某些列中的缺失值进行填充。 这个方法可以很容易地用于缺失值或任何其他类型的缺失数据的处理工作。
索引的fillna()
方法的语法如下所示:
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)
value
:要用来填充缺失值的某个值或值的字典。method
:要使用的插值方法。它有多种可用的值,如ffill
,bfill
等。默认为None
,该方法会将所有现有值替换为None
。axis
:指定要填充的轴。默认是0
,表示填充行,1
表示填充列。inplace
:指定fillna()
方法是不是可以修改原始数据,如果在原始数据上进行修改,则为True
,否则为False
。limit
:对于向前或向后填充中要填充的缺失值的最大数量。downcast
:将数据降低到较小的数据类型以减少内存使用。默认为None
。fillna()
方法的返回值是填充了缺失值的数据集。
import pandas as pd
data = {'Name': ['Tom', 'Jerry', 'Micky', 'Minnie', 'Donald', 'Daisy'],
'Age': [20, None, 15, None, 25, 30],
'Gender': ['M', None, 'M', None, 'M', 'F']}
df = pd.DataFrame(data)
print("原始数据为:\n", df)
df.fillna(value=0, inplace=True)
print("\n修改后的数据为:\n", df)
输出结果如下:
原始数据为:
Name Age Gender
0 Tom 20.0 M
1 Jerry NaN None
2 Micky 15.0 M
3 Minnie NaN None
4 Donald 25.0 M
5 Daisy 30.0 F
修改后的数据为:
Name Age Gender
0 Tom 20.0 M
1 Jerry 0.0 0
2 Micky 15.0 M
3 Minnie 0.0 0
4 Donald 25.0 M
5 Daisy 30.0 F
此示例中,我们使用fillna()
方法将数据集中的所有缺失值替换为0
。
import pandas as pd
data = {'Name': ['Tom', 'Jerry', 'Micky', 'Minnie', 'Donald', 'Daisy'],
'Age': [20, None, 15, None, 25, 30],
'Gender': ['M', None, 'M', None, 'M', 'F']}
df = pd.DataFrame(data)
print("原始数据为:\n", df)
df.fillna(method='ffill', inplace=True)
print("\n修改后的数据为:\n", df)
输出结果如下:
原始数据为:
Name Age Gender
0 Tom 20.0 M
1 Jerry NaN None
2 Micky 15.0 M
3 Minnie NaN None
4 Donald 25.0 M
5 Daisy 30.0 F
修改后的数据为:
Name Age Gender
0 Tom 20.0 M
1 Jerry 20.0 M
2 Micky 15.0 M
3 Minnie 15.0 M
4 Donald 25.0 M
5 Daisy 30.0 F
此示例中,我们使用fillna()
方法将数据集中的缺失值用前一个非缺失值进行填充。
fillna()
方法是一个简单而实用的pandas
函数,可用于处理缺失数据的工作。 在数据处理中,数据可能会包含大量的空格,这时就需要使用fillna()
方法来对这些空格进行处理。