📜  R Logistic回归(1)

📅  最后修改于: 2023-12-03 14:46:51.797000             🧑  作者: Mango

R Logistic回归介绍

在统计学和机器学习中,逻辑回归是一种用于建立类别分类模型的回归分析技术。逻辑回归是回归分析的一个特殊形式,它用于预测因变量只有两种输出的情况(二元分类),一种是正类,另一种是负类。这个算法的输出结果是一个介于0和1之间的概率值,我们通过设定一个阈值来确立最终分类。

R 语言中的逻辑回归

在 R 中建立逻辑回归模型通常使用 glm() 函数。下面是一个示例代码:

# 加载数据
data <- read.csv("iris.csv")

# 把Species编码为0/1两类
data$Species <- as.integer(data$Species == "setosa")

# 分割数据集
train_idx <- sample(nrow(data), 0.7 * nrow(data))
train_data <- data[train_idx, ]
test_data <- data[-train_idx, ]

# 拟合逻辑回归模型
model <- glm(Species ~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = train_data, family = "binomial")

# 预测测试集
test_data$pred <- predict(model, newdata = test_data, type = "response")
test_data$pred_class <- as.integer(test_data$pred > 0.5)

# 计算准确率
accuracy <- mean(test_data$pred_class == test_data$Species)
cat("Accuracy:", accuracy, "\n")

在这个例子中,我们使用了 iris 数据集,它包含 150 个数据,每个数据有一些关于花的测量值。

我们把 Species 编码为 0/1 两类,然后把数据集分割为训练集和测试集。我们使用 glm() 函数拟合逻辑回归模型,并使用 predict() 函数预测测试集的结果。最后,我们计算模型在测试集上的准确率来评估模型的表现。

总结

逻辑回归是一个简单但强大的分类技术,在数据分析和机器学习中广泛应用。在 R 中使用 glm() 函数可以快速建立逻辑回归模型,并使用 predict() 函数进行预测。使用交叉验证和其他技术来评估模型的表现是一个重要的步骤,以确保模型在实际数据上的表现足够好。