机器学习中的混淆矩阵(1) - 芒果文档

📌 相关文章

📜 机器学习中的混淆矩阵(1)

📅 最后修改于: 2023-12-03 15:40:19.921000 🧑 作者: Mango

机器学习中的混淆矩阵

在机器学习中，混淆矩阵（Confusion Matrix）是一个重要的工具，用于评估分类模型的性能。它由四个值组成：真正例（True Positives，TP）、假负例（False Negatives，FN）、假正例（False Positives，FP）和真负例（True Negatives，TN）。将这些值组合成一个矩阵可以帮助我们理解模型中发生的错误。

混淆矩阵的示例

假设我们有一个二分类模型，该模型的任务是预测人类是否患有某种疾病。为了评估模型的性能，我们可以将模型的预测结果与实际结果进行比较，并将结果填入混淆矩阵中。

| | 预测为正 | 预测为负 | | --- | --- | --- | | 实际为正 | TP（真正例） | FN（假负例） | | 实际为负 | FP（假正例） | TN（真负例） |

在这个示例中，如果模型正确地预测了人类是否患病，那么这个预测结果就会对应上述表格中的一个值。例如，如果模型正确地预测了一个患者患有该疾病，那么这个预测结果就是一个 TP。

评估模型性能

混淆矩阵可以帮助我们计算多种指标来评估分类模型的性能，例如准确率（Accuracy）、精确率（Precision）、召回率（Recall）和 F1 分数（F1 Score）等。

准确率

准确率是指模型正确预测的样本数占总体样本数的百分比。它可以通过计算矩阵对角线上的值之和来得到，即：

$$ 准确率 = \frac{TP + TN}{TP + TN + FP + FN} $$

精确率

精确率是指模型在预测为正的样本中，实际为正的样本所占的百分比。它可以通过计算 TP 和 FP 之间的比例来得到，即：

$$ 精确率 = \frac{TP}{TP + FP} $$

召回率

召回率是指实际为正的样本中，被模型预测为正的样本所占的百分比。它可以通过计算 TP 和 FN 之间的比例来得到，即：

$$ 召回率 = \frac{TP}{TP + FN} $$

F1 分数

F1 分数是精确率和召回率的加权平均值，最终结果是从 0 到 1 的范围内的单一得分。它可以通过以下公式来计算：

$$ F1 = \frac{2 * 精确率 * 召回率}{精确率 + 召回率} $$

总结

混淆矩阵是评估分类模型性能的重要工具，可以帮助我们理解模型中的错误情况以及计算多种指标（如准确率、精确率、召回率和 F1 分数）来评估模型的性能。