📜  Pandas DataFrame.hist()

📅  最后修改于: 2020-10-29 02:04:18             🧑  作者: Mango

Pandas DataFrame.hist()

hist()函数被定义为一种从数据集中了解某些数值变量分布的快速方法。它将数值变量内的值划分为“ bins”。它计算落入每个箱柜中的检查次数。这些容器负责通过可视化容器来快速直观地了解变量中值的分布。

我们可以使用DataFrame.hist()方法创建直方图,该方法是matplotlib pyplot API的包装器。

它也是快速访问概率分布的有用工具。

句法

DataFrame.hist(data, column=None, by=None, grid=True, xlabelsize=None, xrot=None, ylabelsize=None, yrot=None, ax=None, sharex=False, sharey=False, figsize=None, layout=None, bins=10, **kwds)

参量

  • data一个DataFrame。它是一个保存数据的pandas DataFrame对象。
  • column指字符串或序列。如果通过,它将用于将数据限制为列的子集。
  • by:这是一个可选参数。如果通过,则它将用于形成独立组的直方图。
  • grid:它也是可选参数。用于显示轴网格线。默认值True。
  • xlabelsize:指整数值。默认值无。用于指定x轴标签大小的更改。
  • xrot:表示浮点值。用于旋转x轴标签。默认值无。
  • ylabelsize:表示整数值。用于指定y轴标签大小的更改。
  • yrot:表示浮点值。用于旋转y轴标签。默认值无。
  • ax: Matplotlib轴对象。它定义了我们需要绘制直方图的轴。默认值无。
  • sharex:布尔值。如果ax为None,则默认值为True。否则为False。对于子图,如果value为True,它将共享x轴并将某些x轴标签设置为不可见。其默认值为True。如果斧头为空,则如果传入斧头,则返回False。

注意:在ax和sharex中都传递true,它将更改所有子图的所有x轴标签。

  • sharey:默认值False。如果子图为True,则它共享y轴并将某些y轴标签设置为不可见。
  • figsize:指要创建图形的英寸尺寸。默认情况下,它使用matplotlib.rcParams中的值。
  • layout:这是一个可选参数。它返回直方图布局的(行,列)元组。
  • bins:默认值10。它是指要使用的直方图bin的数量。如果给定一个整数值,则它将返回bin +1 bin边缘的计算值。
  • ** kwds:引用所有其他要传递给matplotlib.pyplot.hist()的绘图关键字参数。

返回值

它返回matplotlib.AxesSubplot或numpy.ndarray。

例1

import pandas as pd
info = pd.DataFrame({
'length': [2, 1.7, 3.6, 2.4, 1],
'width': [4.2, 2.6, 1.6, 5.1, 2.9]
})
hist = info.hist(bins=4)

输出量