📜  使用 nan pandas 计算行数 - Python (1)

📅  最后修改于: 2023-12-03 15:06:48.861000             🧑  作者: Mango

使用 nan pandas 计算行数 - Python

当我们使用pandas读取数据时,经常会出现缺失值NaN。那么如何在计算行数时正确处理NaN呢?

首先,我们来创建一个包含NaN的pandas数据框。

import numpy as np
import pandas as pd

df = pd.DataFrame({
    'A': [1, 2, np.nan, 4],
    'B': [5, np.nan, 7, 8],
    'C': [9, 10, 11, 12]
})

现在,df就包含了NaN值。

接下来,我们可以使用pandas提供的count方法计算非空值的数量。这个方法会自动忽略NaN值。

row_count = df.count(axis=0)[0]

这里,axis=0表示计算列的非空值数量(默认),[0]表示返回第一列的结果,即列A的非空值数量。如果我们想计算行的非空值数量,只需将axis参数改为1

row_count = df.count(axis=1)[0]

完整代码如下:

import numpy as np
import pandas as pd

df = pd.DataFrame({
    'A': [1, 2, np.nan, 4],
    'B': [5, np.nan, 7, 8],
    'C': [9, 10, 11, 12]
})

row_count = df.count(axis=1)[0]

print(row_count)  # 输出:2

这个例子中,row_count等于2,表示第一行中有两个非空值。