📅  最后修改于: 2023-12-03 14:46:52.701000             🧑  作者: Mango
在机器学习领域中,评估分类模型的性能非常重要。混淆矩阵是一种常见的评估分类算法性能的工具。在 R 编程语言中,我们可以使用 confusionMatrix()
来创建混淆矩阵。
要使用混淆矩阵,我们需要安装并加载 caret
库。
install.packages('caret')
library(caret)
confusionMatrix()
函数接受两个向量。一个是预测结果,另一个是真实标签。我们可以使用这些向量来创建混淆矩阵。
# 构造预测结果和真实标签
predicted <- c('a', 'b', 'b', 'a', 'a', 'a', 'a', 'b', 'b', 'b')
actual <- c('a', 'b', 'a', 'a', 'b', 'a', 'b', 'b', 'b', 'a')
# 创建混淆矩阵
cm <- confusionMatrix(predicted, actual)
# 打印混淆矩阵
print(cm)
结果:
Confusion Matrix and Statistics
Reference
Prediction a b
a 3 1
b 2 4
Accuracy : 0.7
95% CI : (0.355, 0.9246)
No Information Rate : 0.5
P-Value [Acc > NIR] : 0.2659
Kappa : 0.2857
Mcnemar's Test P-Value : 1.0000
Statistics by Class:
Class: a Class: b
Sensitivity 0.6000 0.8000
Specificity 0.8000 0.6000
Pos Pred Value 0.7500 0.5714
Neg Pred Value 0.6667 0.8333
Prevalence 0.5000 0.5000
Detection Rate 0.3000 0.4000
Detection Prevalence 0.4000 0.7000
Balanced Accuracy 0.7000 0.7000
混淆矩阵以表格的形式展示了预测结果和真实标签之间的各种情况。例如,我们可以看到在 3 个真正例(a)中,有一个被预测为假反例(b),在 4 个真反例(b)中,有两个被预测为真正例(a)。
在上面的例子中,我们看到混淆矩阵以多种形式提供了有关分类模型性能的有用信息。下面是一些摘录:
混淆矩阵是一种用于评估分类模型性能的工具。在 R 中,我们可以使用 confusionMatrix()
函数创建混淆矩阵,并从中获得有用的信息。