📌  相关文章
📜  如何在 pandas 中用平均值填充 nan 值 - Python (1)

📅  最后修改于: 2023-12-03 15:24:18.579000             🧑  作者: Mango

如何在 Pandas 中用平均值填充 NaN 值

在现实生活中,经常会遇到某些数据缺失或丢失的情况,这些缺失值可以用一些方法来填充,其中之一就是用平均值填充。在 Pandas 中,可以轻松地使用 describe() 函数计算平均值,并使用 fillna() 函数填充缺失值。

步骤

以下是用平均值填充 NaN 值的步骤:

  1. 导入 Pandas 模块
import pandas as pd
  1. 创建 DataFrame
df = pd.DataFrame({'A': [1, 2, 3, None, 5], 'B': [5, 6, None, 8, 9]})

这里我们创建了一个有 NaN 值的 DataFrame。

  1. 计算平均值
mean = df.describe().loc['mean']

使用 describe() 函数可以计算出 DataFrame 的平均值,然后使用 loc[] 函数选取出这些平均值。

  1. 填充缺失值
df.fillna(mean, inplace=True)

使用 fillna() 函数填充缺失值,这里我们将平均值作为填充值。inplace=True 表示原地修改 DataFrame。

  1. 查看修改后的 DataFrame
print(df)

输出结果如下:

     A    B
0  1.0  5.0
1  2.0  6.0
2  3.0  6.0
3  2.75  8.0
4  5.0  9.0

我们可以看到,缺失值已经被平均值填充了。

结论

这就是在 Pandas 中用平均值填充 NaN 值的步骤。通过使用 describe() 函数计算平均值,并使用 fillna() 函数填充缺失值,我们可以轻松地处理数据中缺失值的情况。