📅  最后修改于: 2023-12-03 15:24:20.769000             🧑  作者: Mango
在 R 中通过使用 dplyr
包和 tidyr
包中的函数能够轻松地创建汇总表。下面介绍如何使用这两个包中的函数创建汇总表。
在开始创建汇总表之前,需要安装并加载 dplyr
包和 tidyr
包。
install.packages("dplyr")
install.packages("tidyr")
library(dplyr)
library(tidyr)
首先,创建一个示例数据集用于演示如何创建汇总表。 下面的数据集包含了不同城市和日期下的销售额。
df <- data.frame(
city = c("New York", "New York", "Boston", "Boston", "Chicago", "Chicago"),
date = c("2021-01-01", "2021-01-02", "2021-01-01", "2021-01-02", "2021-01-01", "2021-01-02"),
sales = c(100, 200, 150, 300, 120, 180)
)
使用 group_by()
函数按照城市对数据集进行分组统计。
df_summary_city <- df %>%
group_by(city) %>%
summarize(total_sales = sum(sales))
结果会按照不同城市的总销售额创建一张新表 df_summary_city
,其中列名为 city
和 total_sales
。
同样可以按照日期对数据集进行分组统计。
df_summary_date <- df %>%
group_by(date) %>%
summarize(total_sales = sum(sales))
结果会按照不同日期的总销售额创建一张新表 df_summary_date
,其中列名为 date
和 total_sales
。
在 dplyr
包中可以使用 merge()
函数对已经创建好的汇总表进行组合,以创建一个更全面的汇总表。
df_summary_all <- merge(df_summary_city, df_summary_date, all = TRUE)
结果会将 df_summary_city
和 df_summary_date
两个表按照城市和日期进行拼接,并包含 total_sales
列。
通过使用 dplyr
包和 tidyr
包中的函数能够轻松地创建汇总表,在数据分析过程中能够为人们提供更好的数据洞察力。