📅  最后修改于: 2023-12-03 15:06:48.861000             🧑  作者: Mango
当我们使用pandas读取数据时,经常会出现缺失值NaN
。那么如何在计算行数时正确处理NaN
呢?
首先,我们来创建一个包含NaN
的pandas数据框。
import numpy as np
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, np.nan, 4],
'B': [5, np.nan, 7, 8],
'C': [9, 10, 11, 12]
})
现在,df
就包含了NaN
值。
接下来,我们可以使用pandas提供的count
方法计算非空值的数量。这个方法会自动忽略NaN
值。
row_count = df.count(axis=0)[0]
这里,axis=0
表示计算列的非空值数量(默认),[0]
表示返回第一列的结果,即列A
的非空值数量。如果我们想计算行的非空值数量,只需将axis
参数改为1
。
row_count = df.count(axis=1)[0]
完整代码如下:
import numpy as np
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, np.nan, 4],
'B': [5, np.nan, 7, 8],
'C': [9, 10, 11, 12]
})
row_count = df.count(axis=1)[0]
print(row_count) # 输出:2
这个例子中,row_count
等于2
,表示第一行中有两个非空值。