📅  最后修改于: 2023-12-03 14:41:11.443000             🧑  作者: Mango
fillna
函数填充缺失值 - Python在数据分析和处理中,常常会遇到缺失值(missing values)的情况。缺失值可能是由于各种各样的原因引起的,比如数据采集的过程中出现了错误、数据存储的方式不同、数据丢失等等。在 Python 中,我们可以使用 fillna
函数来填充缺失值。
fillna
函数填充缺失值fillna
函数是 Pandas 库中的一个函数,用于填充缺失值。它的用法非常简单:
df.fillna(value)
其中,df
是要操作的数据框(DataFrame),value
是填充缺失值的值。比如:
import pandas as pd
# 创建一个包含缺失值的数据框
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [None, 6, 7, 8],
'C': [9, 10, 11, 12]})
# 使用 0 填充缺失值
filled_df = df.fillna(0)
# 输出结果
print(filled_df)
运行结果如下:
A B C
0 1.0 0.0 9
1 2.0 6.0 10
2 0.0 7.0 11
3 4.0 8.0 12
从上面的结果中可以看出,缺失值已经被使用 0 填充了。
除了使用一个标量来填充缺失值之外,fillna
函数还支持使用一些其他的填充方式。比如:
# 使用前一行的值填充缺失值
filled_df = df.fillna(method='ffill')
# 使用前一列的值填充缺失值
filled_df = df.fillna(axis=1, method='ffill')
# 使用后一行的值填充缺失值
filled_df = df.fillna(method='bfill')
# 使用后一列的值填充缺失值
filled_df = df.fillna(axis=1, method='bfill')
# 使用平均值填充缺失值
filled_df = df.fillna(df.mean())
# 使用中位数填充缺失值
filled_df = df.fillna(df.median())
在 Python 中,我们可以使用 fillna
函数来填充缺失值。fillna
函数不仅可以使用一个标量来填充缺失值,还支持使用前一行/列、后一行/列、平均值、中位数等多种方式来填充缺失值。通过合理使用 fillna
函数,我们可以更好地处理缺失值的情况。