📅  最后修改于: 2023-12-03 15:07:45.185000             🧑  作者: Mango
在 Pandas 中,有时候我们需要用一个标量(比如零)来替换 DataFrame 中的 NaN 值。这在数据清洗和数据预处理时很常见。
以下是一个示例 DataFrame:
| Name | Age | City | | ----------- | ----- | -------- | | Alice | 27 | NaN | | Bob | 42 | New York | | Charlie | NaN | Toronto | | Dave | 31 | NaN | | Eve | 25 | Paris |
我们想用零替换所有 NaN 值。下面是代码示例:
import pandas as pd
# 创建 DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie', 'Dave', 'Eve'],
'Age': [27, 42, pd.np.nan, 31, 25],
'City': [pd.np.nan, 'New York', 'Toronto', pd.np.nan, 'Paris']
})
# 用零替换所有 NaN 值
df = df.fillna(0)
# 输出 DataFrame
print(df)
代码输出:
Name Age City
0 Alice 27.0 0
1 Bob 42.0 New York
2 Charlie 0.0 Toronto
3 Dave 31.0 0
4 Eve 25.0 Paris
在上述代码中,我们使用了 Pandas 的 fillna()
函数。该函数可以用指定的值(这里是零)替换 DataFrame 中的 NaN 值。
需要注意的是,在 DataFrame 中使用零替换 NaN 值可能导致数据不准确。因此,在具体情况下,我们应该根据实际需要进行决策。