📅  最后修改于: 2023-12-03 15:24:18.570000             🧑  作者: Mango
在数据分析和处理中,我们经常会遇到数据缺失的情况。处理缺失值的方式有多种,其中一种常用的方法是用均值来填充。
在 Pandas 中,我们可以使用fillna
函数来填充 NAN 值。下面是填充均值的示例代码:
import pandas as pd
# 创建一个含有 NAN 值的 DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4, 5],
'B': [6, None, 8, None, 10],
'C': [11, 12, 13, 14, 15]})
# 计算每列的均值
means = df.mean()
# 用均值填充 NAN 值
df.fillna(means, inplace=True)
在上面的示例代码中,我们先创建了一个含有 NAN 值的 DataFrame,并计算了每列的均值。然后使用fillna
函数将 NAN 值替换成均值。最后,我们可以通过设置inplace=True
来在原 DataFrame 上进行修改。
如果只想对某一列进行填充,可以先选择这一列,然后再计算均值并填充 NAN 值。示例代码如下:
import pandas as pd
# 创建一个含有 NAN 值的 DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4, 5],
'B': [6, None, 8, None, 10],
'C': [11, 12, 13, 14, 15]})
# 计算 B 列的均值
mean_b = df['B'].mean()
# 用均值填充 B 列的 NAN 值
df['B'].fillna(mean_b, inplace=True)
在上面的示例代码中,我们先选择了 B 列,然后计算了 B 列的均值并用均值填充 NAN 值。最后,我们可以通过设置inplace=True
来在原 DataFrame 上进行修改。
除了用均值填充 NAN 值,还可以使用中位数、众数等方法来填充。不同的方法可能会对数据产生不同的影响,需要视具体情况而定。