📅  最后修改于: 2023-12-03 15:40:39.990000             🧑  作者: Mango
每周销售交易数据集是一个包含了多个星期的销售交易数据的数据集。每个星期包含了多个店铺的销售交易信息,包括店铺的ID、销售时间、销售额等。该数据集可以帮助数据分析师或者数据科学家了解每个店铺的销售情况以及销售趋势。
| 字段 | 描述 | | ------------------- | ------------------------------------------------------------ | | date | 销售日期 | | shop_id | 店铺ID | | item_id | 商品ID | | item_category_id | 商品类别ID | | item_cnt_day | 当天销售量 | | item_price | 商品单价 | | weekday | 当天星期几(0表示星期天,1表示星期一,以此类推) | | item_category_name | 商品类别名 | | shop_name | 店铺名 | | city | 店铺所在城市 | | revenue | 当天销售总额(item_cnt_day * item_price) | | month | 当前月份 | | year | 当前年份 | | month_beginning | 当月第一天 | | month_length | 当月天数 | | item_name | 商品名称 |
该数据集可以用于以下场景:
数据集的csv文件可以用Pandas库进行导入和处理,也可以用其他数据分析库进行分析和图表展示。
示例代码:
import pandas as pd
# 导入数据集
df = pd.read_csv('dtw.csv')
# 对于以 shop_id = 1 为例的店铺,计算每月销售总额
df_shop1 = df[df['shop_id'] == 1]
df_shop1_monthly = df_shop1.groupby(['year', 'month'])['revenue'].sum().reset_index()
# 用 matplotlib 库绘制折线图
import matplotlib.pyplot as plt
plt.plot(df_shop1_monthly['month'], df_shop1_monthly['revenue'])
plt.title('Monthly revenue for shop 1')
plt.xlabel('Month')
plt.ylabel('Revenue')
plt.show()
该示例代码演示了如何计算店铺1每月的销售总额,并用matplotlib库绘制折线图展示店铺销售趋势。