📅  最后修改于: 2023-12-03 15:25:55.761000             🧑  作者: Mango
dplyr
是R
语言中一个用于数据操作的包,它提供了很多方便快捷的数据操作函数,并且其语法简介易懂。其中排序数据操作是我们在数据清洗中经常用到的。
在使用dplyr
之前,我们需要先安装这个包:
install.packages("dplyr")
library(dplyr)
之后,我们就可以用它提供的函数来排序数据。
我们先创建一个包含电影名称、年份和评分的数据框。
movies <- data.frame(
name = c("The Lord of the Rings", "Godfather", "Forrest Gump", "Star Wars: A New Hope", "Inception"),
year = c(2001, 1972, 1994, 1977, 2010),
rating = c(8.9, 9.2, 8.8, 8.7, 8.8)
)
接下来我们演示如何按照年份和评分排序这个数据框。
首先,我们可以使用arrange
函数来对年份进行排序:
movies_sorted <- movies %>%
arrange(year)
movies_sorted
这将返回按照年份从小到大排序的数据框。
接着,我们可以使用arrange
函数的多列排序功能,对年份和评分进行排序:
movies_sorted <- movies %>%
arrange(year, desc(rating))
movies_sorted
这将返回按照年份从小到大排序,对于年份相同的电影再按照评分从高到低排序的数据框。
最后,我们可以使用select
函数来只显示我们需要的列,使输出更加简洁明了:
movies_sorted <- movies %>%
arrange(year, desc(rating)) %>%
select(name, year, rating)
movies_sorted
输出:
name year rating
1 Godfather 1972 9.2
2 Star Wars: A New Hope 1977 8.7
3 Forrest Gump 1994 8.8
4 The Lord of the Rings 2001 8.9
5 Inception 2010 8.8
在R
语言中,dplyr
包提供了快捷简单的数据操作函数。arrange
函数可以用来排序数据框。可以根据需要对多列进行排序,也可以使用desc
关键字改变排序方向。select
函数则可以只显示需要的列,使输出更加简洁明了。