📅  最后修改于: 2023-12-03 15:34:36.014000             🧑  作者: Mango
回归决策树是一种常见的机器学习算法,用于对给定的数据集进行建模和预测。在 R 编程中,我们可以使用 rpart
包来构建决策树模型。
首先,我们需要安装并加载 rpart
包。在 R 中,可以使用以下命令安装包:
install.packages("rpart")
加载包的命令为:
library(rpart)
为了构建回归决策树模型,我们需要一个训练数据集。这个数据集应该包含我们想要建模和预测的变量以及其他可能有用的变量。在本例中,我们将使用 mtcars
数据集,其中包含了 1974 年的汽车数据。
我们要预测的变量为 mpg
,即汽车每加仑的行驶里程。
# 加载数据集
data(mtcars)
# 查看数据集的前几行
head(mtcars)
接下来,我们可以使用以下代码构建回归决策树模型:
# 构建模型
model <- rpart(mpg ~ ., data=mtcars)
# 查看模型摘要
summary(model)
在这个模型中,mpg
是我们要预测的目标变量,点号(.)表示使用数据集中的所有其他变量作为预测变量。
一旦我们构建好了回归决策树模型,我们可以使用 plot()
函数来可视化它。
# 可视化模型
plot(model)
text(model)
这个可视化展示了我们的数据如何被分割成不同的区域,树的每个节点都表示一个条件。
最后,我们可以使用训练数据外的新数据点来进行预测。
我们可以使用以下命令创建一个新数据集:
# 创建新数据
newdata <- mtcars[1:5, ]
newdata
这个新数据集包含了已知的输入变量值,但不包含我们想要预测的输出变量值。我们可以使用以下代码来对新数据进行预测。
# 进行预测
predictions <- predict(model, newdata)
# 显示预测结果
predictions
这个代码段将输出一个包含预测值的向量。这些值代表模型预测的每个新数据点的 mpg
值。
以上是 R 编程中回归决策树的介绍,包括了安装和加载 rpart 包、构建回归决策树模型、可视化回归决策树以及使用回归决策树进行预测。