📅  最后修改于: 2023-12-03 15:36:14.085000             🧑  作者: Mango
在 R 编程语言中,lm() 是一个常见的函数,用于从数据中建立线性回归模型。除了得到拟合系数和截距之外,lm() 函数还可以提供一个重要的度量 -- R 平方值,它可用来评估模型的拟合优度。
R 平方,又称为决定系数(Coefficient of determination),用于衡量模型拟合数据的程度。其取值范围为 0 到 1,1 表示模型完全拟合数据,而 0 表示模型不能解释数据的任何变异。一般而言,越接近 1 的 R 平方值意味着模型对数据的拟合越好。
使用 lm() 函数建立线性回归模型后,可以通过 summary() 函数来提取 R 平方值。以下是一个简单的例子:
# 生成数据
x <- 1:10
y <- 2 * x + rnorm(10)
# 建立线性回归模型
model <- lm(y ~ x)
# 提取 R 平方
summary(model)$r.squared
在上述代码中,首先生成了一个带有误差的简单线性回归模型。然后,使用 R 中的 lm() 函数生成了该模型,并用 summary() 函数提取了该模型的统计信息,其中包括 R 平方值。最后,我们可以输出 R 平方值,它等于 0.9495,表明这个模型对于这里提供的数据有非常好的拟合度。
需要注意的是,summary() 函数提取的线性回归模型的统计信息非常丰富,因此可以获取拟合系数、拟合优度、标准误、置信区间、 F-检验值等等。因此,在实际工作中,我们应该多加利用这些信息来评估和优化我们的线性回归模型。
R 平方是一个简单而有用的度量,用于评估线性回归模型的拟合优度。在 R 编程语言中,可以使用 lm() 函数来建立线性回归模型,并通过 summary() 函数提取 R 平方值和其他统计信息。这些信息提供了对模型质量的深入理解,并有助于改进建模策略和数据预处理方法。