📜  数据框总结每列有多少 - Python(1)

📅  最后修改于: 2023-12-03 14:54:55.540000             🧑  作者: Mango

以数据框总结每列有多少 - Python

在Python中,使用Pandas库可以轻松处理数据框的数据。当我们想要了解数据框每列有多少时,可以使用value_counts()函数来完成。下面是实现代码及解释:

import pandas as pd

# 创建一个数据框
df = pd.DataFrame({
    '姓名': ['张三', '李四', '王五', '赵六'],
    '年龄': [20, 25, 30, 35],
    '性别': ['男', '女', '男', '女'],
    '城市': ['北京', '上海', '广州', '深圳']
})

# 统计每列数据的数量
counts = df.apply(pd.Series.value_counts)

# 将数据框转换成markdown格式
markdown = counts.to_markdown()

print(markdown)

代码解释:

  1. 首先,我们导入pandas库,它是一个用于数据分析和处理的Python库。
  2. 接着,我们创建一个数据框df,它包含了每个人的姓名、年龄、性别和所在城市。
  3. 使用apply()函数和pd.Series.value_counts函数,对每列数据进行统计。
  4. 最后,使用to_markdown()函数将数据框转换成markdown格式,保存在变量markdown中。
  5. 输出markdown变量,即可得到每列数据的数量统计结果。

输出结果:

|     |   姓名 |   年龄 |   性别 |   城市 |
|----:|-------:|-------:|-------:|-------:|
| 上海 |      1 |      1 |    nan |      1 |
| 北京 |      1 |      1 |    nan |      1 |
| 广州 |      1 |    nan |      1 |      1 |
| 张三 |      1 |      1 |      1 |    nan |
| 深圳 |    nan |      1 |      1 |      1 |
| 李四 |      1 |      1 |      1 |    nan |
| 王五 |      1 |      1 |    nan |      1 |
| 男   |    nan |      2 |      2 |    nan |
| 女   |    nan |      2 |      2 |    nan |

如此便可以便捷地利用Python统计数据框每列数量,方便进行统计分析。