📅  最后修改于: 2023-12-03 15:25:15.778000             🧑  作者: Mango
在 Python 中,经常会遇到数据框中包含“-”表示缺失值的情况,但是在进行数据处理和统计时,通常需要将其替换为 NaN(Not a Number)表示缺失值。下面介绍如何使用 pandas 库中的 DataFrame.replace() 方法实现将“-”替换为 NaN。
首先需要导入 pandas 库和创建一个包含“-”的数据框。
import pandas as pd
# 创建示例数据框
df = pd.DataFrame({'A': [1, 2, '-', 4, 5],
'B': [6, '-', 8, 9, 10],
'C': ['-', '-', '-', '-', '-']})
输出的数据框如下:
A B C
0 1 6 -
1 2 - -
2 - 8 -
3 4 9 -
4 5 10 -
使用 DataFrame.replace() 方法将“-”替换为 NaN。
df.replace('-', pd.np.nan, inplace=True)
代码中,第一个参数为要替换的字符串(即“-”),第二个参数为替换后的值(即 NaN)。
由于要对原数据框进行替换,所以需要将 inplace 参数设为 True。
最终得到的数据框如下:
A B C
0 1.0 6.0 NaN
1 2.0 NaN NaN
2 NaN 8.0 NaN
3 4.0 9.0 NaN
4 5.0 10.0 NaN
使用 DataFrame.replace() 方法可以方便地将数据框中的“-”替换为 NaN,使得数据处理和统计更加方便和准确。