📜  fillna 字符串 - Python (1)

📅  最后修改于: 2023-12-03 14:41:11.443000             🧑  作者: Mango

使用 fillna 函数填充缺失值 - Python

在数据分析和处理中,常常会遇到缺失值(missing values)的情况。缺失值可能是由于各种各样的原因引起的,比如数据采集的过程中出现了错误、数据存储的方式不同、数据丢失等等。在 Python 中,我们可以使用 fillna 函数来填充缺失值。

使用 fillna 函数填充缺失值

fillna 函数是 Pandas 库中的一个函数,用于填充缺失值。它的用法非常简单:

df.fillna(value)

其中,df 是要操作的数据框(DataFrame),value 是填充缺失值的值。比如:

import pandas as pd

# 创建一个包含缺失值的数据框
df = pd.DataFrame({'A': [1, 2, None, 4],
                   'B': [None, 6, 7, 8],
                   'C': [9, 10, 11, 12]})

# 使用 0 填充缺失值
filled_df = df.fillna(0)

# 输出结果
print(filled_df)

运行结果如下:

     A    B   C
0  1.0  0.0   9
1  2.0  6.0  10
2  0.0  7.0  11
3  4.0  8.0  12

从上面的结果中可以看出,缺失值已经被使用 0 填充了。

更多用法

除了使用一个标量来填充缺失值之外,fillna 函数还支持使用一些其他的填充方式。比如:

使用前一行/列的值填充缺失值
# 使用前一行的值填充缺失值
filled_df = df.fillna(method='ffill')

# 使用前一列的值填充缺失值
filled_df = df.fillna(axis=1, method='ffill')
使用后一行/列的值填充缺失值
# 使用后一行的值填充缺失值
filled_df = df.fillna(method='bfill')

# 使用后一列的值填充缺失值
filled_df = df.fillna(axis=1, method='bfill')
使用平均值/中位数填充缺失值
# 使用平均值填充缺失值
filled_df = df.fillna(df.mean())

# 使用中位数填充缺失值
filled_df = df.fillna(df.median())
总结

在 Python 中,我们可以使用 fillna 函数来填充缺失值。fillna 函数不仅可以使用一个标量来填充缺失值,还支持使用前一行/列、后一行/列、平均值、中位数等多种方式来填充缺失值。通过合理使用 fillna 函数,我们可以更好地处理缺失值的情况。