📅  最后修改于: 2023-12-03 15:04:13.280000             🧑  作者: Mango
确定系数(Coefficient of determination),又称决定系数,用于衡量一个回归模型的质量,其值的范围从0到1,从小到大表示模型的拟合效果越来越好。
通俗来讲,确定系数是用来判断你的预测值与实际值之间的差距到底有多大的。
要计算出一个模型的 R2 分数,需要知道以下两个指标:
R2 分数的计算方式如下:
R2 = 1 - (SSE / SST)
其中,SSE 表示残差平方和,SST 表示总平方和。
在 Python 中,可以通过 scikit-learn 库中的 r2_score 方法很容易地计算出 R2 分数。
from sklearn.metrics import r2_score
# 预测值 y_pred 和实际值 y_true
y_pred = [1, 2, 3, 4]
y_true = [0.9, 1.8, 2.7, 4.2]
# 使用 r2_score 方法计算 R2 分数
r2 = r2_score(y_true, y_pred)
# 输出 R2 分数
print("R2 分数为:", r2)
输出结果为:
R2 分数为: 0.9827067669172932
R2 分数为 1 表示模型的预测值与实际值完全吻合,R2 分数为 0 表示模型的预测值与实际值没有任何关系。在实际应用中,通常认为 R2 分数大于 0.8 的模型拥有较好的预测能力。
通过计算 R2 分数,我们可以评估回归模型的拟合程度,从而更好地理解模型的预测能力。