📅  最后修改于: 2020-10-29 02:04:18             🧑  作者: Mango
hist()函数被定义为一种从数据集中了解某些数值变量分布的快速方法。它将数值变量内的值划分为“ bins”。它计算落入每个箱柜中的检查次数。这些容器负责通过可视化容器来快速直观地了解变量中值的分布。
我们可以使用DataFrame.hist()方法创建直方图,该方法是matplotlib pyplot API的包装器。
它也是快速访问概率分布的有用工具。
DataFrame.hist(data, column=None, by=None, grid=True, xlabelsize=None, xrot=None, ylabelsize=None, yrot=None, ax=None, sharex=False, sharey=False, figsize=None, layout=None, bins=10, **kwds)
data
:一个DataFrame。它是一个保存数据的pandas DataFrame对象。column
:指字符串或序列。如果通过,它将用于将数据限制为列的子集。注意:在ax和sharex中都传递true,它将更改所有子图的所有x轴标签。
它返回matplotlib.AxesSubplot或numpy.ndarray。
import pandas as pd
info = pd.DataFrame({
'length': [2, 1.7, 3.6, 2.4, 1],
'width': [4.2, 2.6, 1.6, 5.1, 2.9]
})
hist = info.hist(bins=4)
输出量