📅  最后修改于: 2023-12-03 15:33:24.565000             🧑  作者: Mango
Pandas 是 Python 语言中一个非常流行的数据分析库,它提供了很多强大的数据操作和分析功能。其中,hist 方法是用于绘制 Pandas 数据框中列的直方图的。
hist 方法可以绘制出数据框中一个或多个列的直方图。只要将需要绘制的列名作为列表传递给 hist 方法即可。例如,下面的代码将数据框 df 中名为 'col1' 的列的直方图绘制出来:
import pandas as pd
df = pd.DataFrame({'col1': [1, 2, 3, 4, 5]})
df.hist(column='col1')
你还可以同时绘制多个列:
import pandas as pd
df = pd.DataFrame({'col1': [1, 2, 3, 4, 5], 'col2': [2, 4, 6, 8, 10]})
df.hist(column=['col1', 'col2'])
hist 方法有很多参数可以控制直方图的绘制,以下是一些常用的参数:
更多参数可以查看 Pandas 官方文档。
下面的代码示例演示了如何使用 hist 方法绘制数据框中多个列的直方图,并自定义一些参数:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 生成数据
np.random.seed(0)
df = pd.DataFrame({'A': np.random.randn(1000),
'B': 1.5 + 2.5 * np.random.randn(1000),
'C': np.random.uniform(5, 32, 1000)})
# 绘制直方图
df.hist(bins=20, color='steelblue', edgecolor='black', grid=False,
xlabelsize=12, ylabelsize=12, figsize=(10, 8))
plt.tight_layout(rect=(0, 0, 1.2, 1.2))
该代码将数据框中的三列分别绘制为直方图,并将柱状的数量设为 20,柱状的颜色为钢蓝色,柱状的边缘颜色为黑色,不显示网格线,x 和 y 轴标签的字号为 12,图形尺寸为 10*8。同时,使用 matplotlib 提供的 tight_layout 方法将图形的四个边缘与子图之间的间距压缩到最小,以此获得更好的可视化效果。
使用 Pandas 数据框的 hist 方法可以快速绘制直方图,为数据分析和数据可视化提供了很大的便利。熟练掌握 hist 方法的参数和用法可以帮助你更好地展示数据特征和趋势。