Pandas GroupBy 中的最大和最小日期
先决条件:熊猫
Pandas GroupBy 是非常强大的函数。此函数能够将数据集拆分为不同的组进行分析。
句法:
dataframe.groupby([column names])
除了 groupby函数,我们还可以使用 pandas 库的 agg()函数。 Agg()函数聚合用于查找数据集中的最小值、最大值、平均值、总和的数据。
句法:
dataframe.agg(dictionary with keys as column name)
方法:
- 导入模块
- 创建或加载数据
- 在您想要的列上使用 GroupBy函数
- 然后在日期列上使用 agg()函数。
- 显示结果
使用中的数据框:
程序:
Python3
import pandas as pd
import numpy as np
# Creating Dataframe
dataset = {'Group': ['G-2', 'G-3', 'G-3', 'G-2', 'G-2',
'G-2', 'G-3', 'G-1', 'G-1', 'G-2'],
'Date': ['2019-11-04', '2020-05-17', '2020-12-12',
'2019-10-15', '2019-01-31', '2019-02-13',
'2020-12-25', '2018-06-01', '2018-07-15',
'2019-09-14']}
dataset = pd.DataFrame(dataset, columns=['Group', 'Date'])
# using groupby() function on Group column
df = dataset.groupby(['Group'])
# using agg() function on Date column
df2 = df.agg(Minimum_Date=('Date', np.min), Maximum_Date=('Date', np.max))
# Displaying result
display(df2)
输出: