📅  最后修改于: 2023-12-03 14:54:55.540000             🧑  作者: Mango
在Python中,使用Pandas库可以轻松处理数据框的数据。当我们想要了解数据框每列有多少时,可以使用value_counts()
函数来完成。下面是实现代码及解释:
import pandas as pd
# 创建一个数据框
df = pd.DataFrame({
'姓名': ['张三', '李四', '王五', '赵六'],
'年龄': [20, 25, 30, 35],
'性别': ['男', '女', '男', '女'],
'城市': ['北京', '上海', '广州', '深圳']
})
# 统计每列数据的数量
counts = df.apply(pd.Series.value_counts)
# 将数据框转换成markdown格式
markdown = counts.to_markdown()
print(markdown)
代码解释:
pandas
库,它是一个用于数据分析和处理的Python库。df
,它包含了每个人的姓名、年龄、性别和所在城市。apply()
函数和pd.Series.value_counts
函数,对每列数据进行统计。to_markdown()
函数将数据框转换成markdown格式,保存在变量markdown
中。markdown
变量,即可得到每列数据的数量统计结果。输出结果:
| | 姓名 | 年龄 | 性别 | 城市 |
|----:|-------:|-------:|-------:|-------:|
| 上海 | 1 | 1 | nan | 1 |
| 北京 | 1 | 1 | nan | 1 |
| 广州 | 1 | nan | 1 | 1 |
| 张三 | 1 | 1 | 1 | nan |
| 深圳 | nan | 1 | 1 | 1 |
| 李四 | 1 | 1 | 1 | nan |
| 王五 | 1 | 1 | nan | 1 |
| 男 | nan | 2 | 2 | nan |
| 女 | nan | 2 | 2 | nan |
如此便可以便捷地利用Python统计数据框每列数量,方便进行统计分析。