📅  最后修改于: 2023-12-03 15:00:00.397000             🧑  作者: Mango
En Python, es común encontrarse con datos faltantes o vacíos, representados por NaN, Null o simplemente como una cadena vacía (""). En esta guía, aprenderemos cómo filtrar estos valores inútiles usando algunas técnicas sencillas.
Para filtrar valores NaN, podemos usar la función Pandas.isna()
. Esta función devuelve una matriz booleana que identifica cuáles son los valores NaN en un DataFrame.
import pandas as pd
df = pd.read_csv('data.csv')
# Filtrando valores NaN en el DataFrame
df = df[pd.notna(df)]
Para filtrar valores Null, podemos usar la función Pandas.notnull()
. Esta función devuelve una matriz booleana que identifica cuáles son los valores Null en un DataFrame.
import pandas as pd
df = pd.read_csv('data.csv')
# Filtrando valores Null en el DataFrame
df = df[pd.notnull(df)]
Para filtrar valores vacíos, podemos usar la función Pandas.dropna()
. Esta función elimina todas las filas que contienen un valor vacío.
import pandas as pd
df = pd.read_csv('data.csv')
# Filtrando valores vacíos en el DataFrame
df = df.dropna()
También es posible filtrar valores vacíos de una columna específica utilizando la función Pandas.DataFrame.loc[]
.
import pandas as pd
df = pd.read_csv('data.csv')
# Filtrando valores vacíos en una columna específica
df = df.loc[df['nombre_de_columna'] != '']
Al filtrar valores faltantes o vacíos de nuestros datos, podemos asegurarnos de que nuestros algoritmos y modelos de machine learning se ajusten a datos limpios y precisos.
Espero que esta guía haya sido útil para usted al aprender cómo filtrar valores NaN, Null y vacíos en Python.