📅  最后修改于: 2023-12-03 15:11:38.785000             🧑  作者: Mango
当需要统计某个数据集合中非空单元格的数量时,可以使用 COUNTA 函数。在Python中,我们可以使用 pandas 库来实现该功能。
要使用 pandas,需要先安装它。可以通过以下命令轻松安装:
pip install pandas
在 pandas 中,可以使用 count
函数来统计非空单元格的数量。以下是一些示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'姓名': ['小明', '小红', '小刚', '小李'],
'语文成绩': [85, 76, None, 90],
'数学成绩': [90, 88, 92, None],
'英语成绩': [92, None, 88, 84]}
df = pd.DataFrame(data)
# 统计每列中非空单元格的数量
count = df.count()
print(count)
输出:
姓名 4
语文成绩 3
数学成绩 3
英语成绩 3
dtype: int64
上述示例代码中,我们创建了一个包含 4 个学生成绩的数据集,并使用 count
函数统计了每列中非空单元格的数量。
在统计完数据集中每列非空单元格的数量后,我们可以使用 matplotlib 库来绘制柱形图,以便更直观地了解值的分布情况。以下是示例代码:
import pandas as pd
import matplotlib.pyplot as plt
# 创建一个示例数据集
data = {'姓名': ['小明', '小红', '小刚', '小李'],
'语文成绩': [85, 76, None, 90],
'数学成绩': [90, 88, 92, None],
'英语成绩': [92, None, 88, 84]}
df = pd.DataFrame(data)
# 统计每列中非空单元格的数量,并绘制柱形图
count = df.count()
plt.bar(count.index, count)
plt.title('非空单元格数量')
plt.xlabel('列名')
plt.ylabel('数量')
plt.show()
输出:
上述示例代码中,我们使用 matplotlib 库的 bar
函数绘制了一个柱形图,用于展示每列中非空单元格的数量。其中 count.index
表示使用数据集中列名作为 x 轴,count
表示使用每列非空单元格数量作为 y 轴,plt.title
、plt.xlabel
和 plt.ylabel
分别表示设置图表标题、x 轴标签和 y 轴标签。
import pandas as pd
import matplotlib.pyplot as plt
# 创建一个示例数据集
data = {'姓名': ['小明', '小红', '小刚', '小李'],
'语文成绩': [85, 76, None, 90],
'数学成绩': [90, 88, 92, None],
'英语成绩': [92, None, 88, 84]}
df = pd.DataFrame(data)
# 统计每列中非空单元格的数量,并绘制柱形图
count = df.count()
plt.bar(count.index, count)
plt.title('非空单元格数量')
plt.xlabel('列名')
plt.ylabel('数量')
plt.show()
通过使用 pandas 库的 count
函数和 matplotlib 库的 bar
函数,可以方便地统计数据集中非空单元格的数量,并将其可视化为柱形图。这为数据分析提供了很大的便利。