在 R 中的线性回归中指定参考因子水平
在本文中,我们将讨论如何在 R 编程语言中的线性回归中指定参考因子级别。
在 R 语言的基本线性回归模型中,默认情况下,参考类别 1 用于因子变量。但有时我们需要在线性回归模型中手动设置参考因子水平。为此,我们使用 R 语言的 relevel()函数。 relevel()函数用于对因子向量的级别进行重新排序。对因子向量的级别进行重新排序,以便用户指定的级别在前,其他级别向下移动。
具有默认参考因子水平的线性回归模型
为了创建一个基本的线性回归模型,我们使用 R 语言的 lm()函数。 lm()函数用于将线性模型拟合到 R 语言中的数据框。它可用于对未知数据的预测进行线性回归。 lm()函数将数据框和拟合函数作为参数,并返回经过训练的线性回归模型。
Syntax:
lm( fitting_function, data )
Parameter:
- fitting_function: determines the function used to fit the data frame.
- data: determines the data frame used in linear regression.
例子:
这是具有默认参考因子水平的基本线性回归模型。
R
# create sample data frame
x <- sample(1:7, 500, replace = TRUE)
y <- round(x + rnorm(500), 3)
x <- as.factor(x)
sample_data <- data.frame(x, y)
# create linear model
linear_model <- lm( y~x, sample_data)
# print summary of linear model
summary(linear_model)
R
# create sample data frame
x <- sample(1:7, 500, replace = TRUE)
y <- round(x + rnorm(500), 3)
x <- as.factor(x)
sample_data <- data.frame(x, y)
# refactor reference level
sample_data$x <- relevel(sample_data$x, ref = 4)
# create linear model
linear_model <- lm( y~x, sample_data)
# print summary of linear model
summary(linear_model)
输出:
此处,默认情况下,因子参考水平为 x1。
具有手动参考因子水平的线性回归模型
要在 R 语言中指定手动参考因子水平,我们将使用 relevel()函数。 relevel()函数用于对因子向量进行重新排序,以便用户指定的级别在前,其他级别下移。 relevel()函数将因子向量和参考水平作为参数,并返回根据用户设置的参考水平重新排序的因子向量。
Syntax:
relevel( factor_vector, ref )
Parameter:
- factor_vector: determines the factor vector which is to be reordered.
- ref: determines the reference level according to which factor is to be reordered.
例子:
这是一个基本的线性回归模型,因子参考水平设置为 4。
R
# create sample data frame
x <- sample(1:7, 500, replace = TRUE)
y <- round(x + rnorm(500), 3)
x <- as.factor(x)
sample_data <- data.frame(x, y)
# refactor reference level
sample_data$x <- relevel(sample_data$x, ref = 4)
# create linear model
linear_model <- lm( y~x, sample_data)
# print summary of linear model
summary(linear_model)
输出: