📜  显示分布 pandas 列 - Python (1)

📅  最后修改于: 2023-12-03 15:26:20.015000             🧑  作者: Mango

显示分布 pandas 列 - Python

在 Pandas 中,我们可以使用 value_counts() 函数来获取一个 Series 中元素的数量分布。

下面是一个例子:

import pandas as pd

data = pd.Series([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])
print(data.value_counts())

输出:

4    4
3    3
2    2
1    1
dtype: int64

我们也可以将 value_counts() 的结果转化为 DataFrame,使得我们可以更方便地对其进行处理和可视化。

import pandas as pd

data = pd.Series([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])
df = pd.DataFrame(data.value_counts().reset_index())
df.columns = ['value', 'count']
print(df)

输出:

   value  count
0      4      4
1      3      3
2      2      2
3      1      1

这样,我们就可以使用不同的可视化工具来展示数据的分布。比如,我们可以使用 matplotlib 来绘制一个直方图:

import matplotlib.pyplot as plt

plt.hist(data, bins=range(1, 6), align='left')
plt.xlabel('Value')
plt.ylabel('Count')
plt.show()

输出:

Histogram

我们也可以使用 seaborn 来绘制一个更漂亮的直方图:

import seaborn as sns

sns.histplot(data, bins=range(1, 6), binwidth=0.5, stat='density', color='blue', alpha=0.5)
sns.rugplot(data, color='black', alpha=0.5)
plt.xlabel('Value')
plt.ylabel('Density')
plt.show()

输出:

Histogram with Rugplot

以上就是在 Pandas 中如何显示某一列的分布了。