📜  带有 plotly 的分类数据的直方图 - Python (1)

📅  最后修改于: 2023-12-03 15:25:26.676000             🧑  作者: Mango

带有 Plotly 的分类数据的直方图 - Python

在数据分析和可视化中,直方图是一种常见的数据可视化图表类型。直方图用于展示数值变量在不同区间内的分布情况,可以帮助我们更好地理解数据分布的特征。在本文中,我们将介绍如何使用 Python 中的 Plotly 库创建带有分类数据的直方图。

准备工作

在使用本文中的代码之前,您需要安装 plotly 库和 pandas 库。如果您已经安装了这些库,则可以跳过这一步。

使用以下命令安装这些库:

!pip install plotly pandas

在安装完成后,您需要导入这些库:

import plotly.express as px
import pandas as pd
加载数据

为了演示如何创建带有分类数据的直方图,我们使用美国州的数据。我们使用 pandas 库读取数据,然后选择一些特定的列,这些列可以用作直方图的输入。

url_data="https://raw.githubusercontent.com/plotly/datasets/master/2014_usa_states.csv"
df=pd.read_csv(url_data)
df=df[['state', 'pop_2014', 'date_of_admittance']]
df.head()

这将输出前5行数据:

| | state | pop_2014 | date_of_admittance | |---:|:----------------|-----------:|:---------------------| | 0 | Alabama | 4849377 | December 14, 1819 | | 1 | Alaska | 736732 | January 3, 1959 | | 2 | Arizona | 6731484 | February 14, 1912 | | 3 | Arkansas | 2966369 | June 15, 1836 | | 4 | California | 38802500 | September 9, 1850 |

创建带有分类数据的直方图

使用 Plotly 库创建直方图的过程非常简单!我们只需要使用 px.histogram() 函数,然后选择要显示的列以及要使用的分类变量。

在下面的代码中,我们选择 pop_2014 列作为直方图的输入,然后使用 date_of_admittance 列作为分类变量。请查看代码和结果:

fig = px.histogram(df, x="pop_2014", nbins=50, color="date_of_admittance")
fig.show()

结果:

带有分类数据的直方图

从上图可以看到,所有州都按照它们成立的日期进行了分类,并且直方图显示了每个分类中的人口分布情况。

此外,我们还可以使用 facet_colfacet_row 参数创建多个直方图,每个直方图都使用分类变量进行分类。例如,如果您想按州名分类,可以使用以下代码:

fig = px.histogram(df, x="pop_2014", nbins=50, color="date_of_admittance", facet_col="state")
fig.show()

此代码将创建具有多个面板的直方图,每个面板都显示一个州的数据,直方图将按照常规的方式显示该面板中的数据。这是一个非常方便的选项,因为它使您能够同时查看许多子集中的分布情况。

这就是如何使用 Python 和 Plotly 库创建带有分类数据的直方图。如果您想了解更多关于 Plotly 的信息,可以查看 Plotly 官方文档