在 R DataFrame 中插入缺失日期的行
在本文中,我们将看到如何在 R 编程语言中为缺失的日期插入行。
R 中的 padr 包用于使用 pad()函数准备时间序列数据。可以使用以下命令将该软件包下载并安装到工作空间中:
install.packages(“padr”)
R 中的 pad 方法用于执行日期填充。它用于填充从数据帧获得的第一个和最后一个值之间的所有观察值。它自己计算出数据框中的日期时间变量是什么,从而评估其间隔。它为间隔内数据集中缺少的每个缺少的时间点执行插入。 NA 或缺失值被插入到数据框中所有非日期时间变量行的数据框中。
pad(data-frame)
示例 1:
R
library("padr")
# creating data frame
data_frame <- data.frame(col1 = as.Date(c("2021-08-02",
"2021-08-04",
"2021-08-09",
"2021-08-10")),
col2 = letters[1:4])
print("Data Frame")
print(data_frame)
# modified data
data_frame_mod <- pad(data_frame)
print(data_frame_mod)
R
library("padr")
# creating data frame
data_frame <- data.frame(col1 = as.Date(c("2021-10-29",
"2021-11-01",
"2021-11-04"
)),
col2 = letters[1:3])
print("Data Frame")
print(data_frame)
# modified data
data_frame_mod <- pad(data_frame)
print(data_frame_mod)
输出:
以下代码片段不会在数据框中添加任何行,因为所有相应的日期都在同一时间间隔内,即 3 天的时间段。使用 pad() 方法时,此信息会显示在控制台上。
示例 2:
电阻
library("padr")
# creating data frame
data_frame <- data.frame(col1 = as.Date(c("2021-10-29",
"2021-11-01",
"2021-11-04"
)),
col2 = letters[1:3])
print("Data Frame")
print(data_frame)
# modified data
data_frame_mod <- pad(data_frame)
print(data_frame_mod)
输出:
此外,可以自定义 pad() 方法以使用“小时”或“分钟”附加间隔,并分别使用 start_val 和 end_val 参数指定开始和结束间隔值。然后将缺失值附加到指定的间隔中。
pad( 'hour' , start_val = , end_val = )