📅  最后修改于: 2023-12-03 15:18:15.576000             🧑  作者: Mango
在数据分析和统计过程中,我们经常需要计算多个时间段之间的数据变化百分比。Pandas是一种流行的Python库,用于数据处理和分析。Pandas提供了一些方便的工具,用于计算跨多个时间段的百分比变化。
我们将使用一个示例数据集,该数据集包含两列:年份和销售额。
import pandas as pd
# 创建示例数据集
data = {'Year': [2010, 2011, 2012, 2013, 2014],
'Sales': [100, 120, 140, 160, 180]}
df = pd.DataFrame(data)
print(df)
这将输出以下数据集:
Year Sales
0 2010 100
1 2011 120
2 2012 140
3 2013 160
4 2014 180
现在,我们可以使用Pandas内置的shift
函数,将上一年的销售额移动到当前行。然后,我们可以计算百分比变化并将其添加到数据集中。
# 计算百分比变化
df['Change'] = df['Sales'].pct_change().mul(100).round(2)
# 移动上一年的销售额到当前行
df['Prev Year Sales'] = df['Sales'].shift(1)
print(df)
这将输出以下数据集:
Year Sales Change Prev Year Sales
0 2010 100 NaN NaN
1 2011 120 20.0 100.0
2 2012 140 16.67 120.0
3 2013 160 14.29 140.0
4 2014 180 12.5 160.0
现在,我们有了一个数据集,其中包含销售额、变化和上一年的销售额。我们可以使用这些数据来绘制一些有趣的图表和可视化。
在本教程中,我们介绍了使用Pandas计算跨多个时间段的百分比变化的方法。我们展示了如何将百分比变化和前一年的数据添加到数据集中,并使用数据生成一些有趣的图表和可视化。