如何在 pandas 中用平均值填充 nan 值 - Python (1) - 芒果文档

📌 相关文章

📜 如何在 pandas 中用平均值填充 nan 值 - Python (1)

📅 最后修改于: 2023-12-03 15:24:18.579000 🧑 作者: Mango

如何在 Pandas 中用平均值填充 NaN 值

在现实生活中，经常会遇到某些数据缺失或丢失的情况，这些缺失值可以用一些方法来填充，其中之一就是用平均值填充。在 Pandas 中，可以轻松地使用 describe() 函数计算平均值，并使用 fillna() 函数填充缺失值。

步骤

以下是用平均值填充 NaN 值的步骤：

导入 Pandas 模块

import pandas as pd

创建 DataFrame

df = pd.DataFrame({'A': [1, 2, 3, None, 5], 'B': [5, 6, None, 8, 9]})

这里我们创建了一个有 NaN 值的 DataFrame。

计算平均值

mean = df.describe().loc['mean']

使用 describe() 函数可以计算出 DataFrame 的平均值，然后使用 loc[] 函数选取出这些平均值。

填充缺失值

df.fillna(mean, inplace=True)

使用 fillna() 函数填充缺失值，这里我们将平均值作为填充值。inplace=True 表示原地修改 DataFrame。

查看修改后的 DataFrame

print(df)

输出结果如下：

     A    B
0  1.0  5.0
1  2.0  6.0
2  3.0  6.0
3  2.75  8.0
4  5.0  9.0

我们可以看到，缺失值已经被平均值填充了。

结论

这就是在 Pandas 中用平均值填充 NaN 值的步骤。通过使用 describe() 函数计算平均值，并使用 fillna() 函数填充缺失值，我们可以轻松地处理数据中缺失值的情况。