确定公式的系数
在数学中,数据收集、分析、感知、引入、数据组织的研究属于统计学范畴。在统计学中,决定系数用于注意一个变量的对比度如何由另一个变量的对比度来定义。比如,一个人是否会得到一份工作,他们与他/她接受的面试有直接关系。特别是,R-squared 给出了由 x 变量定义的 y 的百分比变化。它在 0 到 1 之间变化(因此,y 的 0% 到 100% 变化可以由 x 变量定义)。它类似于相关系数(R)。相关系数表明两个变量之间存在多强的线性关系,而 R 平方是相关系数的平方(称为 r 平方)。
确定系数
决定系数可以看作是一个百分比。它提供了一个观点,即多个数据点如何落入由反转方程创建的线的结果中。系数越大,当绘制数据点和消耗的线时,事实线通过的百分比就越高。或者我们可以说,决定系数是从自变量预测的因变量的方差比例。如果系数为 0.70,则 70% 的点将落在回归线内。更大的系数是更适合陈述的指标。 1 和 0 的值必须显示不包含或包含所有数据的回归线。
如果决定系数 (CoD) 不利,则意味着您的样本不适合您的数据。如果没有设置截距,它可能会变得不利。
决定系数通常写为 R 2 _p。这里,p表示有效的数据列的数字,同时类似于各种数据集的R 2 。
- 如果 R 2 = 0,则无法从自变量预测因变量。
- 如果 R 2 = 1,则可以从自变量预测因变量。
- 如果 R 2 = 在 0 和 1 之间,则这意味着因变量是可预测的。
测定系数的性质
- 它允许平衡可以从另一个变量中预期的变量如何改变。
- 如果我们想查看根据提供的数据进行预测的精确度,我们可以通过此度量选择相同的值。
- 它允许找到插图解释/总解释
- 它还允许我们知道变量之间的连接(线性)的力量。
- 如果 r 2的物质接近 1,则 y 的物质在反转线附近演化,同样,如果接近 0,则值远离反转线。
- 它有助于定义不同变量之间的联系能力。
决定系数公式
决定系数的公式可以写成两种不同的方式:
公式1:
R = n(∑xy) – (∑x)(∑y) / √[n∑x2 – (∑x)2][n∑y2 – (∑y)2]
这里,R代表决定系数,n称为观察总数,∑x称为第一个变量值的总和,∑y称为第二个变量值,∑xy称为总和第一个值和第二个值的乘积,∑x 2称为第一个值的平方和,∑y 2称为第二个值的平方和
公式二:
R2 = 1 -(RSS/TSS)
其中,R 表示决定系数,RSS 称为残差平方和,TSS 称为总平方和。
计算决定系数的步骤
Step 1: Firstly find the correlation coefficient(or maybe it is mentioned in the question for e.g, r = 0.467).
R = n(∑xy) – (∑x)(∑y) / √[n∑x2 – (∑x)2][n∑y2 – (∑y)2]
Step 2: Now square the correlation coefficient
0.6572 =.432
Step 3: Now covert the correlation coefficient(R) into the percentage
.432 = 43.2%
示例问题
问题1:从以下给定数据中找出确定的相关性? GLUCOSE LEVEL YSUBJECT AGE X 1 42 98 2 23 68 3 22 73 4 47 79 5 50 88 6 60 82
解决方案:
Firstly to get the CoD to find out the correlation coefficient of the given data. Make a table from the given data and add three more columns of XY, X², and Y².add all the values in the columns to get ∑xy, ∑x, ∑y, ∑x2, and ∑y2 and n = 6. GLUCOSE LEVEL YSUBJECT AGE X XY X2 Y2 1 42 98 4116 1764 9604 2 23 68 1564 529 4624 3 22 73 1606 484 5329 4 47 79 3713 2209 6241 5 50 88 4400 2500 7744 6 60 82 4980 3600 6724 ∑ 244 488 20379 11086 40266
∑xy = 20379
∑x = 244
∑y = 488
∑x2 = 11086
∑y2 = 40266
n = 6.
Put all the values in the coefficient of determination formula:-
R = n(∑xy) – (∑x)(∑y) / √[n∑x2 – (∑x)2][n∑y2 – (∑y)2]
R = 6(20379) – (244)(488) / √ [6(11086) – (244)2][6(40266) – (488)2]
R = 3202/√ [6980][3452]
R = 3202/4972.238
R = 0.6439
Now do the square of correlation coefficient
R2 = (0.6439)2 = .415
Convert the R-squared into the percentage
.415 × 100 = 41.5%
So, 41.5% variation of y can be explained by x-variables.
问题2:从以下给定数据中找出决定系数?
X = 21、31、25、40、47、38 和 Y = 70、55、60、78、66、80
解决方案:-
Given variables are,
X = 21, 31, 25, 40, 47, 38
and
Y = 70, 55, 60, 78, 66, 80
Firstly to get the CoD to find out the correlation coefficient of the given data. To, find the correlation coefficient of the following variables Firstly a table is to be constructed as follows, to get the values required in the formula.X Y XY X2 Y2 5 6 30 25 36 9 10 90 81 100 14 16 224 196 256 16 20 320 256 400 ∑ 44 ∑ 52 ∑ 664 ∑ 558 ∑ 792
∑xy = 664
∑x = 44
∑y = 52
∑x2 = 558
∑y2 = 792
n = 4
Put all the values in the coefficient of determination formula:
R = n(∑xy) – (∑x)(∑y) / √[n∑x2 – (∑x)2][n∑y2 – (∑y)2]
R = 6(13937) – (202)(409) / √ [6(7280) – (202)2][6(28265) – (409)2]
R = 1004 / √[2876][2909]
R = 1004 / 2892.452938
R = -0.3471
Now do the square of correlation coefficient
R2 = (0.3471)2 = .129
Convert the R-squared into the percentage
.129 × 100 = 12.9%
So, 12.9% variation of y can be explained by x-variables.
问题 3:给定 X = 5 ,9 ,14, 16 和 Y = 6, 10, 16, 20。求决定系数。
解决方案:
Given variables are,
X = 5 ,9 ,14, 16
and
Y = 6, 10, 16, 20
Firstly to get the CoD to find out the correlation coefficient of the given data. To, find the correlation coefficient of the following variables Firstly a table is to be constructed as follows, to get the values required in the formula.X Y XY X2 Y2 5 6 30 25 36 9 10 90 81 100 14 16 224 196 256 16 20 320 256 400 ∑44 ∑52 ∑664 ∑558 ∑792
∑xy = 664
∑x = 44
∑y = 52
∑x2 = 558
∑y2 = 792
n = 4
Put all the values in the coefficient of determination formula:-
R = n(∑xy) – (∑x)(∑y) / √[n∑x2 – (∑x)2][n∑y2 – (∑y)2]
R = 4(664) – (44)(52) / √ [4(558) – (44)2][4(792) – (52)2]
R = 368 / √[296][464]
R = 368/370.599
R = 0.993
Now do the square of correlation coefficient
R2 = (0.993)2 = .987
Convert the R-squared into the percentage
.987 × 100 = 98.7%
So, 98.7% variation of y can explained by x-variables.
问题4:相关系数为0.6894。找出决定系数。
解决方案:
The correlation coefficient = .6894 (square the correlation coefficient)
R = .6894
R2 = .476
Convert the R-squared into the percentage
.476 × 100 = 47.6
The coefficient of determination is 47.6 percent.
问题 5:相关系数为 0.3659。找出决定系数。
解决方案:
The correlation coefficient = .3659 (square the correlation coefficient)
R = .3659
R2 = .134
Convert the R-squared into the percentage
.134 ×100 = 13.4
The coefficient of dete