📅  最后修改于: 2023-12-03 15:23:17.560000             🧑  作者: Mango
线性回归分析是统计学中一种常用的数据分析方法,通常用于研究两个或更多变量之间的关系。在 R 编程语言中,可以使用 lm() 函数来执行线性回归分析。
lm() 函数的语法如下:
lm(formula, data)
其中,formula 为公式,用于描述要建立的线性回归模型。它通常的格式为:y ~ x1 + x2 + … + xn,其中 y 表示要预测的变量,x1, x2, …, xn 表示影响 y 的自变量。data 则是包含要分析的变量数据的数据集。
下面以一组房价数据为例,来演示如何使用 lm() 函数执行线性回归分析:
# 导入数据
data <- read.csv("house_price.csv")
# 查看数据
head(data)
# 构建线性回归模型
model <- lm(price ~ sqft_living + condition + yr_built, data)
# 查看模型摘要
summary(model)
在这个例子中,我们首先使用 read.csv() 函数导入了一个包含房价、居住面积、房屋状况和建造年份等属性的数据集。然后,我们使用 lm() 函数构建了一个线性回归模型,其中要预测的变量是价格,自变量包括居住面积、房屋状况和建造年份等。最后,我们使用 summary() 函数查看了模型的摘要信息,包括每个变量的显著性和拟合优度等。
在 R 编程语言中,lm() 函数是执行线性回归分析的常用方法之一。通过合理构建公式和数据集,我们可以轻松的建立线性回归模型,并对其进行分析和优化。