📜  排序数据帧 dply - R 编程语言(1)

📅  最后修改于: 2023-12-03 15:25:55.761000             🧑  作者: Mango

排序数据帧 dplyr - R 编程语言

dplyrR语言中一个用于数据操作的包,它提供了很多方便快捷的数据操作函数,并且其语法简介易懂。其中排序数据操作是我们在数据清洗中经常用到的。

安装dplyr包

在使用dplyr之前,我们需要先安装这个包:

install.packages("dplyr")
加载包
library(dplyr)

之后,我们就可以用它提供的函数来排序数据。

例子

我们先创建一个包含电影名称、年份和评分的数据框。

movies <- data.frame(
  name = c("The Lord of the Rings", "Godfather", "Forrest Gump", "Star Wars: A New Hope", "Inception"),
  year = c(2001, 1972, 1994, 1977, 2010),
  rating = c(8.9, 9.2, 8.8, 8.7, 8.8)
)

接下来我们演示如何按照年份和评分排序这个数据框。

首先,我们可以使用arrange函数来对年份进行排序:

movies_sorted <- movies %>% 
                 arrange(year)
movies_sorted

这将返回按照年份从小到大排序的数据框。

接着,我们可以使用arrange函数的多列排序功能,对年份和评分进行排序:

movies_sorted <- movies %>% 
                 arrange(year, desc(rating))
movies_sorted

这将返回按照年份从小到大排序,对于年份相同的电影再按照评分从高到低排序的数据框。

最后,我们可以使用select函数来只显示我们需要的列,使输出更加简洁明了:

movies_sorted <- movies %>% 
                 arrange(year, desc(rating)) %>% 
                 select(name, year, rating)
movies_sorted

输出:

                   name year rating
1         Godfather         1972    9.2
2 Star Wars: A New Hope 1977    8.7
3           Forrest Gump 1994    8.8
4  The Lord of the Rings 2001    8.9
5              Inception 2010    8.8
总结

R语言中,dplyr包提供了快捷简单的数据操作函数。arrange函数可以用来排序数据框。可以根据需要对多列进行排序,也可以使用desc关键字改变排序方向。select函数则可以只显示需要的列,使输出更加简洁明了。