毫升 |回归分析中的 R 平方
R 平方是一种统计度量,表示回归模型的拟合优度。 r-square 的理想值为 1。r-square 的值越接近 1,模型拟合越好。
R-square 是残差平方和(SS res )与总平方和(SS tot ) 的比较。总平方和是通过数据点与平均线之间的垂直距离的平方和来计算的。
通过数据点与最佳拟合线之间的垂直距离的平方和计算得出的残差平方和。
R 平方使用以下公式计算:
其中SS res是残差平方和, SS tot是总平方和。
回归模型的拟合优度可以在R-square方法的基础上进行分析。 r-square 的值越接近 1,模型越好。
注意:当拟合的模型比平均拟合模型差时,R-square 的值也可能为负。
使用 R 方方法的局限性 –
- r-square 的值总是随着新变量添加到模型中而增加或保持不变,而不会检测到这个新添加变量的显着性(即 r-square 的值永远不会随着向模型添加新属性而减少)。因此,随着 r 平方值的增加,也可以将不重要的属性添加到模型中。
- 这是因为SS tot总是常数,回归模型试图通过找到与这个新属性的一些相关性来降低 SS res的值,因此 r 平方的整体值增加,这可能导致回归模型不佳。