📜  绘制值 counta - Python (1)

📅  最后修改于: 2023-12-03 15:11:38.785000             🧑  作者: Mango

绘制值 counta - Python

当需要统计某个数据集合中非空单元格的数量时,可以使用 COUNTA 函数。在Python中,我们可以使用 pandas 库来实现该功能。

1. 安装 pandas

要使用 pandas,需要先安装它。可以通过以下命令轻松安装:

pip install pandas
2. 统计非空单元格

在 pandas 中,可以使用 count 函数来统计非空单元格的数量。以下是一些示例代码:

import pandas as pd

# 创建一个示例数据集
data = {'姓名': ['小明', '小红', '小刚', '小李'],
        '语文成绩': [85, 76, None, 90],
        '数学成绩': [90, 88, 92, None],
        '英语成绩': [92, None, 88, 84]}
df = pd.DataFrame(data)

# 统计每列中非空单元格的数量
count = df.count()
print(count)

输出:

姓名        4
语文成绩     3
数学成绩     3
英语成绩     3
dtype: int64

上述示例代码中,我们创建了一个包含 4 个学生成绩的数据集,并使用 count 函数统计了每列中非空单元格的数量。

3. 绘制值分布图

在统计完数据集中每列非空单元格的数量后,我们可以使用 matplotlib 库来绘制柱形图,以便更直观地了解值的分布情况。以下是示例代码:

import pandas as pd
import matplotlib.pyplot as plt

# 创建一个示例数据集
data = {'姓名': ['小明', '小红', '小刚', '小李'],
        '语文成绩': [85, 76, None, 90],
        '数学成绩': [90, 88, 92, None],
        '英语成绩': [92, None, 88, 84]}
df = pd.DataFrame(data)

# 统计每列中非空单元格的数量,并绘制柱形图
count = df.count()
plt.bar(count.index, count)
plt.title('非空单元格数量')
plt.xlabel('列名')
plt.ylabel('数量')
plt.show()

输出:

counta-python.png

上述示例代码中,我们使用 matplotlib 库的 bar 函数绘制了一个柱形图,用于展示每列中非空单元格的数量。其中 count.index 表示使用数据集中列名作为 x 轴,count 表示使用每列非空单元格数量作为 y 轴,plt.titleplt.xlabelplt.ylabel 分别表示设置图表标题、x 轴标签和 y 轴标签。

代码片段
import pandas as pd
import matplotlib.pyplot as plt

# 创建一个示例数据集
data = {'姓名': ['小明', '小红', '小刚', '小李'],
        '语文成绩': [85, 76, None, 90],
        '数学成绩': [90, 88, 92, None],
        '英语成绩': [92, None, 88, 84]}
df = pd.DataFrame(data)

# 统计每列中非空单元格的数量,并绘制柱形图
count = df.count()
plt.bar(count.index, count)
plt.title('非空单元格数量')
plt.xlabel('列名')
plt.ylabel('数量')
plt.show()
结论

通过使用 pandas 库的 count 函数和 matplotlib 库的 bar 函数,可以方便地统计数据集中非空单元格的数量,并将其可视化为柱形图。这为数据分析提供了很大的便利。