📌  相关文章
📜  pandas 数据框 hist 标题 - Python (1)

📅  最后修改于: 2023-12-03 15:33:24.565000             🧑  作者: Mango

使用 Pandas 数据框hist方法绘制直方图 - Python

Pandas 是 Python 语言中一个非常流行的数据分析库,它提供了很多强大的数据操作和分析功能。其中,hist 方法是用于绘制 Pandas 数据框中列的直方图的。

介绍

hist 方法可以绘制出数据框中一个或多个列的直方图。只要将需要绘制的列名作为列表传递给 hist 方法即可。例如,下面的代码将数据框 df 中名为 'col1' 的列的直方图绘制出来:

import pandas as pd
df = pd.DataFrame({'col1': [1, 2, 3, 4, 5]})
df.hist(column='col1')

你还可以同时绘制多个列:

import pandas as pd
df = pd.DataFrame({'col1': [1, 2, 3, 4, 5], 'col2': [2, 4, 6, 8, 10]})
df.hist(column=['col1', 'col2'])
参数

hist 方法有很多参数可以控制直方图的绘制,以下是一些常用的参数:

  • column:需要绘制直方图的列名,可以是一个字符串或一个列表。
  • bins:直方图的柱状数量,默认为 10。
  • grid:是否显示网格线,默认为 True。
  • xlabelsize/ylabelsize:x 轴和 y 轴标签的字号,默认为 10。
  • figsize:绘制直方图的图形尺寸,默认为 (6, 4)。
  • color:直方图的柱状颜色。

更多参数可以查看 Pandas 官方文档。

示例

下面的代码示例演示了如何使用 hist 方法绘制数据框中多个列的直方图,并自定义一些参数:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 生成数据
np.random.seed(0)
df = pd.DataFrame({'A': np.random.randn(1000),
                   'B': 1.5 + 2.5 * np.random.randn(1000),
                   'C': np.random.uniform(5, 32, 1000)})

# 绘制直方图
df.hist(bins=20, color='steelblue', edgecolor='black', grid=False,
        xlabelsize=12, ylabelsize=12, figsize=(10, 8))
plt.tight_layout(rect=(0, 0, 1.2, 1.2))

该代码将数据框中的三列分别绘制为直方图,并将柱状的数量设为 20,柱状的颜色为钢蓝色,柱状的边缘颜色为黑色,不显示网格线,x 和 y 轴标签的字号为 12,图形尺寸为 10*8。同时,使用 matplotlib 提供的 tight_layout 方法将图形的四个边缘与子图之间的间距压缩到最小,以此获得更好的可视化效果。

总结

使用 Pandas 数据框的 hist 方法可以快速绘制直方图,为数据分析和数据可视化提供了很大的便利。熟练掌握 hist 方法的参数和用法可以帮助你更好地展示数据特征和趋势。