📜  bouger des lignes dplyr (1)

📅  最后修改于: 2023-12-03 14:39:34.850000             🧑  作者: Mango

Bouger des lignes dplyr

Introduction

dplyr est un package R qui offre des outils pour travailler avec des données. Il est très utilisé pour les opérations de manipulation de données, comme la séleciton de colonnes, la création de nouvelles variables, le filtrage de données, etc. Dans cet article, nous allons présenter les fonctions de base de dplyr pour manipuler les lignes d'un dataframe.

Chargement de la librarie dplyr

La première étape est de charger la librairie dplyr en utilisant la commande suivante:

library(dplyr)
Sélection de lignes

La fonction filter() peut être utilisée pour sélectionner des lignes selon un critère. Par exemple, pour sélectionner toutes les lignes où la variable mpg est supérieure ou égale à 20, on utilise la commande suivante:

data(mtcars)
mtcars %>% filter(mpg >= 20)

Cette commande renvoie un nouveau dataframe qui contient uniquement les lignes satisfaisant le critère.

Tri des lignes

La fonction arrange() permet de trier les lignes d'un dataframe selon une ou plusieurs variables. Par exemple, pour trier les lignes du dataframe mtcars selon la variable mpg en ordre décroissant, on utilise la commande suivante:

mtcars %>% arrange(desc(mpg))

Cette commande renvoie un nouveau dataframe contenant les mêmes variables que mtcars, mais avec les lignes triées selon mpg.

Ajout de nouvelles lignes

La fonction add_row() permet d'ajouter de nouvelles lignes à un dataframe. Par exemple, pour ajouter une nouvelle ligne contenant des données pour une nouvelle voiture à mtcars, on utilise la commande suivante:

mtcars %>% add_row(mpg = 30, cyl = 4, disp = 120, hp = 102, drat = 3.7, wt = 2.5, qsec = 15.5, vs = 0, am = 1, gear = 4, carb = 3)

Cette commande renvoie un nouveau dataframe contenant toutes les mêmes variables que mtcars plus une nouvelle ligne représentant la nouvelle voiture.

Suppression de lignes

La fonction slice() permet de supprimer des lignes d'un dataframe. Par exemple, pour supprimer les deux premières lignes de mtcars, on utilise la commande suivante:

mtcars %>% slice(-c(1:2))

Cette commande renvoie un nouveau dataframe contenant toutes les mêmes variables que mtcars, mais sans les deux premières lignes.

Conclusion

Dans cet article, nous avons présenté les fonctions de base de dplyr pour manipuler les lignes d'un dataframe. Nous avons vu comment sélectionner des lignes, trier des lignes, ajouter des nouvelles lignes et supprimer des lignes. Ces fonctions sont très utiles pour manipuler efficacement des données et faciliter l'analyse de données en R.