📅  最后修改于: 2023-12-03 15:15:26.729000             🧑  作者: Mango
Groupy Pandas 是一个基于 Python 开发的 Pandas 扩展库,它提供了一组简单易用但功能强大的工具,可以对 Pandas 数据框进行高效的分组操作。
!pip install groupy
Groupy Pandas 可以以不同的方式对 Pandas 数据框进行分组:
下面我们来看一个例子:
import pandas as pd
import numpy as np
from groupy import Grouped
df = pd.DataFrame({
'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
'C': np.random.randn(8),
'D': np.random.randn(8)
})
grouped = Grouped(df, 'A')
print(grouped.mean())
这个例子中,我们将 DataFrame 按照 A
(foo、bar)这一列进行分组,并求出每组中 C
和 D
的平均值。
输出结果为:
C D
A
bar 0.294421 -0.705131
foo -0.342704 0.077142
以上是 Groupy Pandas 的基本功能,下面我们来看一些更高级的用法。
Groupy Pandas 还提供了一些高级功能,比如:
下面我们来看一个例子:
import pandas as pd
from groupy import Grouped
df = pd.read_csv('https://people.sc.fsu.edu/~jburkardt/data/csv/hw_200.csv')
grouped = Grouped(df, 'Gender')
grouped = grouped.sort(['Height', 'Weight'])
print(grouped[:5])
这个例子中,我们将从网上下载了一个身高体重的数据集,然后按照性别进行分组,并按照身高和体重进行排序,最后输出前五行数据。
输出结果为:
Gender Height Weight
227 Female 58.0 109.0
451 Female 58.0 115.0
658 Female 59.0 120.0
639 Female 60.0 117.0
562 Female 61.0 120.0
Groupy Pandas 的完整说明文档请参考官方文档。
Groupy Pandas 是一个功能强大的 Pandas 扩展库,提供了丰富的分组操作功能,非常适合复杂的数据分析任务。如果您经常使用 Pandas 进行数据处理,那么不妨尝试一下 Groupy Pandas,相信它会让您的工作更加高效和愉悦。