📅  最后修改于: 2023-12-03 15:40:49.837000             🧑  作者: Mango
在 pandas 中, dropna
函数可以删除含有缺失值的数据。
举个例子,假设我们有如下数据集:
import pandas as pd
data = pd.DataFrame({
'a': [1, 2, None, 4],
'b': [5, None, 7, 8],
'c': [9, 10, 11, 12]
})
其中包含了一些缺失值。我们可以使用 dropna
函数删除这些缺失值所在的行:
data_no_missing = data.dropna()
然而,这将删除所有有缺失值的行。有时候,我们只想删除缺失值出现在特定列的行。这时候,我们可以使用传递一个参数,指定要删除缺失值的列:
data_no_missing_b = data.dropna(subset=['b'])
这将只删除在 b
列中出现的缺失值。
完整代码:
import pandas as pd
data = pd.DataFrame({
'a': [1, 2, None, 4],
'b': [5, None, 7, 8],
'c': [9, 10, 11, 12]
})
# 删除所有有缺失值的行
data_no_missing = data.dropna()
# 只删除在 b 列中出现的缺失值
data_no_missing_b = data.dropna(subset=['b'])
以上就是如何使用 dropna
函数删除特定列中的缺失值的方法了。