📅  最后修改于: 2023-12-03 15:24:18.579000             🧑  作者: Mango
在现实生活中,经常会遇到某些数据缺失或丢失的情况,这些缺失值可以用一些方法来填充,其中之一就是用平均值填充。在 Pandas 中,可以轻松地使用 describe() 函数计算平均值,并使用 fillna() 函数填充缺失值。
以下是用平均值填充 NaN 值的步骤:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, None, 5], 'B': [5, 6, None, 8, 9]})
这里我们创建了一个有 NaN 值的 DataFrame。
mean = df.describe().loc['mean']
使用 describe() 函数可以计算出 DataFrame 的平均值,然后使用 loc[] 函数选取出这些平均值。
df.fillna(mean, inplace=True)
使用 fillna() 函数填充缺失值,这里我们将平均值作为填充值。inplace=True 表示原地修改 DataFrame。
print(df)
输出结果如下:
A B
0 1.0 5.0
1 2.0 6.0
2 3.0 6.0
3 2.75 8.0
4 5.0 9.0
我们可以看到,缺失值已经被平均值填充了。
这就是在 Pandas 中用平均值填充 NaN 值的步骤。通过使用 describe() 函数计算平均值,并使用 fillna() 函数填充缺失值,我们可以轻松地处理数据中缺失值的情况。