📅  最后修改于: 2023-12-03 15:37:25.596000             🧑  作者: Mango
在数据处理中,经常会遇到一些缺失数据(missing data)。pandas 是一种常用的数据处理工具,提供了一些方法来插入缺失数据。
可以使用 pandas 的 DataFrame() 函数来创建含有缺失数据的 DataFrame。示例代码如下所示:
import pandas as pd
data = {'a': [1, 2, 3, None, 5],
'b': [None, 6, 7, 8, 9],
'c': [10, 11, None, 13, 14]}
df = pd.DataFrame(data)
上面的代码创建了一个 DataFrame,其中第一列有一个缺失值,第二列有两个缺失值,第三列有一个缺失值。
可以使用 pandas 中的 isnull() 函数来查看 DataFrame 中的缺失数据。示例代码如下所示:
print(df.isnull())
输出结果如下:
a b c
0 False True False
1 False False False
2 False False True
3 True False False
4 False False False
可以使用 pandas 中的 fillna() 函数来填充 DataFrame 中的缺失数据。示例代码如下所示:
df = df.fillna(value=0)
上面的代码将 DataFrame 中的缺失数据填充为 0。
可以使用 pandas 中的 dropna() 函数来删除 DataFrame 中的缺失数据。示例代码如下所示:
df = df.dropna()
上面的代码将 DataFrame 中含有缺失数据的行删除。
本文介绍了如何在 pandas 中插入缺失数据,以及如何查看、填充和删除缺失数据。通过本文的介绍,您可以更好地应对数据处理中的缺失数据问题。