📜  如何在 R 中绘制预测值?(1)

📅  最后修改于: 2023-12-03 15:38:25.041000             🧑  作者: Mango

如何在 R 中绘制预测值?

在数据分析中,预测是一个非常重要的环节,而绘制预测值则是对预测结果进行可视化的一种方式,可以帮助我们更清晰地理解预测结果。在 R 中,我们可以使用不同的函数和工具来绘制预测值,下面就介绍几种常用的方式:

1. 使用 ggplot2 绘制预测曲线

ggplot2 是 R 中非常常用的可视化库之一,我们可以使用它来绘制预测曲线。首先需要准备好数据,并使用 lm 函数建立回归模型。然后,使用 predict 函数对新数据进行预测,最后将原始数据和预测数据放在一起,使用 ggplot2 中的 geom_line 函数来绘制预测曲线。

# 准备数据
data <- data.frame(x = 1:100, y = rnorm(100))
model <- lm(y ~ x, data = data)

# 预测新数据
new_data <- data.frame(x = 101:110)
pred <- predict(model, newdata = new_data)

# 绘制预测曲线
library(ggplot2)
ggplot(data, aes(x = x, y = y)) +
  geom_point() +
  geom_line(aes(x = c(data$x, new_data$x), y = c(model$fitted.values, pred)), color = "red")

上述代码中,首先使用 data.frame 函数创建数据框,然后使用 lm 函数建立回归模型。接着,使用 data.frame 函数创建新数据,使用 predict 函数对新数据进行预测,得到预测值 pred。最后,使用 ggplot2 绘制散点图和预测曲线,其中使用 geom_point 函数绘制散点图,使用 geom_line 函数绘制预测曲线,aes 函数用于映射变量,颜色设置为红色。

2. 使用 ggplot2 绘制预测区间

除了绘制预测曲线外,我们还可以绘制预测区间,以显示预测值的不确定性。在以上例子的基础上,我们可以使用 predict 函数的 interval 参数指定预测区间,然后再使用 ggplot2 中的 geom_ribbon 函数来绘制预测区间。

# 预测新数据并计算预测区间
new_data <- data.frame(x = 101:110)
pred <- predict(model, newdata = new_data, interval = "predict")

# 绘制预测区间
ggplot(data, aes(x = x, y = y)) +
  geom_point() +
  geom_ribbon(aes(x = c(data$x, new_data$x), ymin = c(pred[, 2], pred[, 2]), ymax = c(pred[, 3], pred[, 3])), alpha = 0.2, fill = "red") +
  geom_line(aes(x = c(data$x, new_data$x), y = c(model$fitted.values, pred[, 1])), color = "red")

上述代码中,我们在使用 predict 函数时指定 interval 参数为 "predict",表示计算预测区间。接着,使用 ggplot2 中的 geom_ribbon 函数绘制预测区间,其中 aes 函数用于映射变量,alpha 参数用于设置透明度,fill 参数用于设置填充颜色。最后,使用 geom_line 函数绘制预测曲线。

3. 使用 plot 函数绘制预测曲线

除了 ggplot2 外,我们还可以使用 plot 函数绘制预测曲线。首先需要使用 lm 函数计算回归模型,然后使用 predict 函数对新数据进行预测,最后使用 plot 函数绘制预测曲线。

# 准备数据并建立回归模型
data <- data.frame(x = 1:100, y = rnorm(100))
model <- lm(y ~ x, data = data)

# 预测新数据
new_data <- data.frame(x = 101:110)
pred <- predict(model, newdata = new_data)

# 绘制预测曲线
plot(data$x, data$y)
lines(c(data$x, new_data$x), c(model$fitted.values, pred), col = "red")

上述代码中,首先准备数据并使用 lm 函数建立回归模型。接着,使用 data.frame 函数创建新数据,使用 predict 函数对新数据进行预测,得到预测值 pred。最后,使用 plot 函数绘制散点图和预测曲线,其中使用 lines 函数绘制预测曲线,col 参数用于设置颜色。

综上所述,以上是在 R 中绘制预测值的几种常用方式。我们可以根据自己的需求选择适合的方式进行绘制,从而更好地展示预测结果。