📅  最后修改于: 2023-12-03 15:18:13.802000             🧑  作者: Mango
En ocasiones, es necesario eliminar filas de un dataframe en función de una o varias condiciones. En este tutorial, vamos a ver cómo hacerlo utilizando la librería Pandas en Python.
Supongamos que tenemos un dataframe df
como el siguiente:
import pandas as pd
df = pd.DataFrame({'Nombre': ['Juan', 'María', 'Pedro', 'Ana'],
'Edad': [25, 30, 35, 40],
'Ciudad': ['Madrid', 'Barcelona', 'Valencia', 'Sevilla']})
| | Nombre | Edad | Ciudad | |---|--------|------|-----------| | 0 | Juan | 25 | Madrid | | 1 | María | 30 | Barcelona | | 2 | Pedro | 35 | Valencia | | 3 | Ana | 40 | Sevilla |
Si queremos eliminar las filas en las que la ciudad sea 'Madrid', podemos utilizar el siguiente código:
df = df[df.Ciudad != 'Madrid']
Este código utiliza la notación de filtro de Pandas para seleccionar sólo las filas que cumplan la condición especificada ('Ciudad' diferente de 'Madrid') y sobrescribe el dataframe original con el resultado.
| | Nombre | Edad | Ciudad | |---|--------|------|-----------| | 1 | María | 30 | Barcelona | | 2 | Pedro | 35 | Valencia | | 3 | Ana | 40 | Sevilla |
También es posible utilizar varias condiciones. Por ejemplo, si queremos eliminar las filas en las que la ciudad sea 'Madrid' y la edad sea mayor o igual a 30, podemos utilizar el siguiente código:
df = df[(df.Ciudad != 'Madrid') & (df.Edad < 30)]
| | Nombre | Edad | Ciudad | |---|--------|------|--------| | 0 | Juan | 25 | Madrid |
En resumen, para eliminar filas de un dataframe en función de una o varias condiciones en Python utilizando Pandas, podemos utilizar la notación de filtro de Pandas y sobrescribir el dataframe original con el resultado de la selección.