📜  Python|熊猫 dataframe.interpolate()

📅  最后修改于: 2022-05-13 01:55:42.571000             🧑  作者: Mango

Python|熊猫 dataframe.interpolate()

Python是用于进行数据分析的出色语言,主要是因为以数据为中心的Python包的奇妙生态系统。 Pandas就是其中之一,它使导入和分析数据变得更加容易。

Pandas dataframe.interpolate()函数主要用于填充数据框或系列中的NA值。但是,这是一个非常强大的函数来填补缺失值。它使用各种插值技术来填充缺失值,而不是对值进行硬编码。

示例 #1:使用interpolate()函数使用线性方法填充缺失值。

# importing pandas as pd
import pandas as pd
  
# Creating the dataframe 
df = pd.DataFrame({"A":[12, 4, 5, None, 1],
                   "B":[None, 2, 54, 3, None],
                   "C":[20, 16, None, 3, 8],
                   "D":[14, 3, None, None, 6]})
  
# Print the dataframe
df

让我们使用线性方法对缺失值进行插值。请注意,线性方法忽略索引并将值视为等距。

# to interpolate the missing values
df.interpolate(method ='linear', limit_direction ='forward')

输出 :

正如我们所看到的输出,第一行中的值无法被填充,因为值的填充方向是forward的,并且没有可以用于插值的先前值。

示例 #2:使用interpolate()函数使用线性方法反向插入缺失值,并限制可以填充的连续Na值的最大数量。

# importing pandas as pd
import pandas as pd
  
# Creating the dataframe 
df = pd.DataFrame({"A":[12, 4, 5, None, 1],
                   "B":[None, 2, 54, 3, None],
                   "C":[20, 16, None, 3, 8],
                   "D":[14, 3, None, None, 6]})
  
# to interpolate the missing values
df.interpolate(method ='linear', limit_direction ='backward', limit = 1)

输出 :

请注意第四列,因为我们将限制设置为 1,所以只填充了一个缺失值。最后一行中的缺失值无法填充,因为在此之后不存在可以插值的行。