R 编程中的分位数回归
分位数回归是一种研究自变量对因变量分布的不同分位数的影响的算法。分位数回归提供了 Z 和 Y 之间关系的完整图景。它对于 Z 观测值中的异常值是稳健且有效的。在分位数回归中,估计和推断是无分布的。分位数回归是线性回归的扩展,即当不满足线性回归的条件(即线性、独立性或正态性)时,使用它。它将条件分位数函数估计为预测变量的线性组合,用于研究变量的分布关系,有助于检测异方差性,也可用于处理删失变量。在 R 编程中执行分位数回归非常容易。
数学表达式
分位数回归对异常值更加有效和稳健。在分位数回归中,您不仅限于查找中位数,即您可以计算特征变量中特定值的任何百分比(分位数)。例如,如果要找到特定建筑物价格的第 30个分位数,这意味着该建筑物的实际价格有 30% 的可能性低于预测,而有 70% 的可能性是价格在上面。因此,分位数回归模型方程为:
因此,现在 beta 系数不再是常数,而是依赖于分位数起作用。在特定分位数处查找这些 beta 值的过程与常规线性量化的过程几乎相同。我们现在必须减少中值绝对偏差。
此外,数学上p t采用以下形式:
函数p t (u)是检查函数,它为误差赋予不对称权重,这取决于分位数和误差的整体符号。
R中的实现
数据集:
mtcars (motor trend car road test)包含了32辆汽车的油耗、性能、汽车设计的10个方面。它预装了 R 中的dplyr包。
R
# Installing the package
install.packages("dplyr")
# Loading package
library(dplyr)
# Structure of dataset in package
str(mtcars)
R
# Installing Packages
install.packages("quantreg")
install.packages("ggplot2")
install.packages("caret")
# Loading the packages
library(quantreg)
library(dplyr)
library(ggplot2)
library(caret)
# Model: Quantile Regression
Quan_fit <- rq(disp ~ wt, data = mtcars)
Quan_fit
# Summary of Model
summary(Quan_fit)
# Plot
plot(disp ~ wt, data = mtcars, pch = 16, main = "Plot")
abline(lm(disp ~ wt, data = mtcars), col = "red", lty = 2)
abline(rq(disp ~ wt, data = mtcars), col = "blue", lty = 2)
输出:
对数据集执行分位数回归:
通过使用数据集中的特征或变量训练模型,对数据集使用分位数回归算法。
R
# Installing Packages
install.packages("quantreg")
install.packages("ggplot2")
install.packages("caret")
# Loading the packages
library(quantreg)
library(dplyr)
library(ggplot2)
library(caret)
# Model: Quantile Regression
Quan_fit <- rq(disp ~ wt, data = mtcars)
Quan_fit
# Summary of Model
summary(Quan_fit)
# Plot
plot(disp ~ wt, data = mtcars, pch = 16, main = "Plot")
abline(lm(disp ~ wt, data = mtcars), col = "red", lty = 2)
abline(rq(disp ~ wt, data = mtcars), col = "blue", lty = 2)
输出:
- 模型 Quan_fit:
Quan_fit 模型的截距为 -129.7880,自由度为 32。
- 型号总结:
该模型的 tau 值为 0.5,bd 下限为 -185.6818,bd 上限为 -100.5439,系数为 -129.7880。
- 阴谋:
该图以蓝色显示分位数回归线,以红色显示线性回归线。因此,分位数回归应用程序被用于增长图表、统计、回归分析。
分位数回归的优点
- 有助于理解具有预测变量的非线性关系的数据变量之间的关系。
- 它对异常值是健壮和有效的。
- 它有助于获得统计离散度,这有助于更深入地审查变量之间的关系。