📜  Python – 确定系数-R2 分数(1)

📅  最后修改于: 2023-12-03 15:04:13.280000             🧑  作者: Mango

Python - 确定系数-R2 分数

简介

确定系数(Coefficient of determination),又称决定系数,用于衡量一个回归模型的质量,其值的范围从0到1,从小到大表示模型的拟合效果越来越好。

通俗来讲,确定系数是用来判断你的预测值与实际值之间的差距到底有多大的。

计算方式

要计算出一个模型的 R2 分数,需要知道以下两个指标:

  • SSE:sum of the squared errors
  • SST:total sum of errors

R2 分数的计算方式如下:

R2 = 1 - (SSE / SST)

其中,SSE 表示残差平方和,SST 表示总平方和。

代码实现

在 Python 中,可以通过 scikit-learn 库中的 r2_score 方法很容易地计算出 R2 分数。

from sklearn.metrics import r2_score

# 预测值 y_pred 和实际值 y_true
y_pred = [1, 2, 3, 4]
y_true = [0.9, 1.8, 2.7, 4.2]

# 使用 r2_score 方法计算 R2 分数
r2 = r2_score(y_true, y_pred)

# 输出 R2 分数
print("R2 分数为:", r2)

输出结果为:

R2 分数为: 0.9827067669172932
结论

R2 分数为 1 表示模型的预测值与实际值完全吻合,R2 分数为 0 表示模型的预测值与实际值没有任何关系。在实际应用中,通常认为 R2 分数大于 0.8 的模型拥有较好的预测能力。

通过计算 R2 分数,我们可以评估回归模型的拟合程度,从而更好地理解模型的预测能力。