📜  Pandas bins pd.cut() - Python (1)

📅  最后修改于: 2023-12-03 15:33:23.425000             🧑  作者: Mango

Pandas bins pd.cut() - Python

pandas.cut()是一个将数据分成不同区间的函数。它可以帮助我们更好地理解数据,处理数据,并对数据进行可视化。在此,我们将介绍如何使用pandas cut来分组数据和创建直方图。

Getting Started

在使用pd.cut()之前,我们需要确保已经安装了pandas库。

pip install pandas

接下来,我们需要导入pandas库和numpy库。

import pandas as pd
import numpy as np
Data Preparation

让我们首先创建一些数据,以便我们可以演示如何使用pandas cut函数。

data = np.random.randint(0, 100, 20)
df = pd.DataFrame({'Age': data})

这将创建一个数据框,其中包含20个随机整数,在0和100之间。我们将这些整数作为我们的年龄数据。

Grouping Data

现在我们已经准备好使用pd.cut()将我们的数据分组了。首先,我们需要选择我们将使用的分组范围。

bins = [0, 25, 50, 75, 100]

这将创建四个不同的区间,我们将使用这些区间将我们的数据框分成四组。

接下来,我们将使用pd.cut()来实际分组我们的数据。

df['Age Group'] = pd.cut(df['Age'], bins)
print(df)

这将在我们的数据框中创建一个新的列“年龄组”,其中将我们的年龄数据分组到我们指定的区间中。

Creating Histograms

现在,我们已经成功地将我们的数据分组,让我们使用pd.cut()创建直方图,以可视化我们的数据。

df['Age'].plot.hist(bins=bins, rwidth=0.9, color='#607c8e')

这将创建一个直方图,其中包含四个不同的区间,每个区间包含不同数量的数据点。

Conclusion

pd.cut()是一个非常有用的python函数,可以帮助我们更好地理解我们的数据并将其可视化。它可以帮助我们更好地分组数据,并将数据可视化为直方图,以便我们可以更好地了解我们的数据。