📜  使用 python 计算混淆矩阵(1)

📅  最后修改于: 2023-12-03 15:36:33.557000             🧑  作者: Mango

使用 Python 计算混淆矩阵

混淆矩阵是一个表格,用于评估分类模型的准确性。它显示了模型的预测结果与真实结果之间的差异。

在二分类问题中,混淆矩阵包括 4 个重要的指标:真阳性 (TP)、假阳性 (FP)、真阴性 (TN) 和假阴性 (FN)。

| | 预测正类 | 预测负类 | | --- | --- | --- | | 实际正类 | TP | FN | | 实际负类 | FP | TN |

下面我们将介绍如何使用 Python 计算混淆矩阵。

首先我们需要导入一些必要的库,如下所示:

import numpy as np
from sklearn.metrics import confusion_matrix

接下来,我们需要定义真实结果和预测结果。在这个例子中,我们定义了 6 个样本数据,2 个正类和 4 个负类:

y_true = np.array([1, 1, 0, 0, 0, 0])
y_pred = np.array([1, 0, 1, 0, 0, 0])

现在,我们可以使用 confusion_matrix() 函数计算混淆矩阵了:

tn, fp, fn, tp = confusion_matrix(y_true, y_pred).ravel()

其中,ravel() 函数用于将混淆矩阵压缩成一维数组。注意,此处的变量名与混淆矩阵中的标签相对应。

最后,我们可以打印出结果:

print("真阳性 (TP):", tp)
print("假阳性 (FP):", fp)
print("真阴性 (TN):", tn)
print("假阴性 (FN):", fn)

输出结果为:

真阳性 (TP): 1
假阳性 (FP): 1
真阴性 (TN): 3
假阴性 (FN): 1

这说明我们的模型预测了一个真正的正例,一个假正例,三个真负例和一个假负例。

这就是使用 Python 计算混淆矩阵的方法。希望这篇文章能够帮助你更好地理解混淆矩阵的概念,以及如何在 Python 中计算混淆矩阵。