📅  最后修改于: 2023-12-03 15:26:20.015000             🧑  作者: Mango
在 Pandas 中,我们可以使用 value_counts() 函数来获取一个 Series 中元素的数量分布。
下面是一个例子:
import pandas as pd
data = pd.Series([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])
print(data.value_counts())
输出:
4 4
3 3
2 2
1 1
dtype: int64
我们也可以将 value_counts() 的结果转化为 DataFrame,使得我们可以更方便地对其进行处理和可视化。
import pandas as pd
data = pd.Series([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])
df = pd.DataFrame(data.value_counts().reset_index())
df.columns = ['value', 'count']
print(df)
输出:
value count
0 4 4
1 3 3
2 2 2
3 1 1
这样,我们就可以使用不同的可视化工具来展示数据的分布。比如,我们可以使用 matplotlib 来绘制一个直方图:
import matplotlib.pyplot as plt
plt.hist(data, bins=range(1, 6), align='left')
plt.xlabel('Value')
plt.ylabel('Count')
plt.show()
输出:
我们也可以使用 seaborn 来绘制一个更漂亮的直方图:
import seaborn as sns
sns.histplot(data, bins=range(1, 6), binwidth=0.5, stat='density', color='blue', alpha=0.5)
sns.rugplot(data, color='black', alpha=0.5)
plt.xlabel('Value')
plt.ylabel('Density')
plt.show()
输出:
以上就是在 Pandas 中如何显示某一列的分布了。