📅  最后修改于: 2023-12-03 14:45:02.319000             🧑  作者: Mango
在数据分析应用程序中,处理缺失值是一个常见的任务。 Pandas是一个流行的自由开源Python库,它提供了一系列的数据结构和数据分析工具,其中包括一些函数来计算数据框架中缺失值的数量,使得缺失值的处理变得更加容易和高效。
Pandas提供了三个函数来计算数据帧中缺失值的数量:
isnull()
: 在DataFrame上返回布尔值,以指示哪些元素为缺失值。isna()
: 在DataFrame上返回布尔值,以指示哪些元素为缺失值。sum()
: 在DataFrame上的每列计算缺失值的总数。以下是一个例子,说明如何使用这些函数来计算DataFrame中缺失值的数量:
import pandas as pd
# 创建一个包含缺失值的数据帧
df = pd.DataFrame({
'A': [1, 2, None, 4],
'B': [5, None, 7, 8],
'C': [None, 10, 11, 12]
})
# 计算缺失值的数量
print('isnull():')
print(df.isnull().sum())
print('\nisna():')
print(df.isna().sum())
输出将会是:
isnull():
A 1
B 1
C 2
dtype: int64
isna():
A 1
B 1
C 2
dtype: int64
另外,你还可以使用 count()
函数计算每列中的非缺失值的数量,例如:
print('count():')
print(df.count())
输出:
count():
A 3
B 3
C 2
dtype: int64
在Pandas中计算缺失值的数量是一项简单但经常使用的任务。可以使用 isnull()
和 isna()
函数来测试DataFrame中的每个元素是否为缺失值,使用 sum()
函数来计算每列中缺失值的数量,使用 count()
函数来计算每列中的非缺失值的数量。这些函数可以极大地简化处理缺失值的Python代码的编写。