📜  机器学习中的混淆矩阵(1)

📅  最后修改于: 2023-12-03 15:40:19.921000             🧑  作者: Mango

机器学习中的混淆矩阵

在机器学习中,混淆矩阵(Confusion Matrix)是一个重要的工具,用于评估分类模型的性能。它由四个值组成:真正例(True Positives,TP)、假负例(False Negatives,FN)、假正例(False Positives,FP)和真负例(True Negatives,TN)。将这些值组合成一个矩阵可以帮助我们理解模型中发生的错误。

混淆矩阵的示例

假设我们有一个二分类模型,该模型的任务是预测人类是否患有某种疾病。为了评估模型的性能,我们可以将模型的预测结果与实际结果进行比较,并将结果填入混淆矩阵中。

| | 预测为正 | 预测为负 | | --- | --- | --- | | 实际为正 | TP(真正例) | FN(假负例) | | 实际为负 | FP(假正例) | TN(真负例) |

在这个示例中,如果模型正确地预测了人类是否患病,那么这个预测结果就会对应上述表格中的一个值。例如,如果模型正确地预测了一个患者患有该疾病,那么这个预测结果就是一个 TP。

评估模型性能

混淆矩阵可以帮助我们计算多种指标来评估分类模型的性能,例如准确率(Accuracy)、精确率(Precision)、召回率(Recall)和 F1 分数(F1 Score)等。

准确率

准确率是指模型正确预测的样本数占总体样本数的百分比。它可以通过计算矩阵对角线上的值之和来得到,即:

$$ 准确率 = \frac{TP + TN}{TP + TN + FP + FN} $$

精确率

精确率是指模型在预测为正的样本中,实际为正的样本所占的百分比。它可以通过计算 TP 和 FP 之间的比例来得到,即:

$$ 精确率 = \frac{TP}{TP + FP} $$

召回率

召回率是指实际为正的样本中,被模型预测为正的样本所占的百分比。它可以通过计算 TP 和 FN 之间的比例来得到,即:

$$ 召回率 = \frac{TP}{TP + FN} $$

F1 分数

F1 分数是精确率和召回率的加权平均值,最终结果是从 0 到 1 的范围内的单一得分。它可以通过以下公式来计算:

$$ F1 = \frac{2 * 精确率 * 召回率}{精确率 + 召回率} $$

总结

混淆矩阵是评估分类模型性能的重要工具,可以帮助我们理解模型中的错误情况以及计算多种指标(如准确率、精确率、召回率和 F1 分数)来评估模型的性能。