填充空列 – Pandas
有时数据框包含一个空列,可能会在现实生活场景中造成真正的问题。缺失数据也可以指熊猫中的 NA(不可用)值。在 DataFrame 中,有时许多数据集只是带着丢失的数据到达,要么是因为它存在但未被收集,要么从未存在。在本文中,让我们看看如何使用 Pandas 填充数据框中的空列。
注意:这里是 csv 文件的链接。
填充空列:
Python3
import pandas as pd
df = pd.read_csv("Persons.csv")
df
Python3
df.set_index('Name ', inplace=True)
df
Python3
df1 = df.fillna(0)
df1
Python3
df2 = df.fillna(method='ffill')
df2
Python3
df3 = df.interpolate()
df3
首先,我们导入 pandas,然后将 CSV 文件加载到 df 变量中。只需尝试在 jupyter notebook 或 colab 中运行它。
输出:
蟒蛇3
df.set_index('Name ', inplace=True)
df
这行用于删除索引值,我们不想要它,所以我们删除它。
输出:
填充空列的方法有好几种,我们一一看
方法一:
在这种方法中,我们将使用“df.fillna(0)”,它将所有 NaN 元素替换为 0。
例子:
蟒蛇3
df1 = df.fillna(0)
df1
输出:
方法二:
在这个方法中,我们将使用“df.fillna(method='ffill')”,它用于向前或向后传播非空值。
Syntax: DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)
蟒蛇3
df2 = df.fillna(method='ffill')
df2
输出:
方法三:
在这个方法中,我们将使用“df.interpolate()”
Syntax: DataFrame.interpolate(method=’linear’, axis=0, limit=None, inplace=False, limit_direction=None, limit_area=None, downcast=None, **kwargs)
蟒蛇3
df3 = df.interpolate()
df3
输出: