相关性基本上意味着两组或更多组数据之间的相互联系。在统计学中,使用双变量数据或两个随机变量来寻找它们之间的相关性。相关系数通常是二元数据之间相关性的度量,它基本上表示两个随机变量彼此相关的程度。
If the correlation coefficient is 0, the bivariate data are not correlated with each other.
If the correlation coefficient is -1 or +1, the bivariate data are strongly correlated with each other.
r=-1 denotes strong negative relationship and r=1 denotes strong positive relationship.
一般来说,如果相关系数接近 -1 或 +1,那么我们可以说双变量数据彼此强相关。
相关系数是使用Pearson相关系数计算的,该系数由下式给出:
在哪里,
- r:相关系数。
-
*** QuickLaTeX cannot compile formula: *** Error message: Error: Nothing to show, formula is empty
:变量 x 的值。
- y_i:变量 y 的值。
- n:数据集中采集的样本数。
- 分子: x 和 y 的协方差。
- 分母: x 的标准差和 y 的标准差的乘积。
在本文中,我们将了解如何在 Excel 中查找相关系数。
示例:考虑以下数据集:
在 Excel 中查找相关系数:
1.使用CORREL函数
在 Excel 中找到相关系数使用公式:
=CORREL(array1,array2)
array1 : array of variable x
array2: array of variable y
To insert array1 and array2 just select the cell range for both.
1. 让我们找出变量与 X 和 Y1 的相关系数。
array1 : Set of values of X. The cell range is from A2 to A6.
array2 : Set of values of Y1. The cell range is from B2 to B6.
同样,您可以使用 Excel 公式找到 (X , Y2) 和 (X , Y3) 的相关系数。最后,相关系数如下:
从上表我们可以推断:
X and Y1 have negative correlation coefficient.
X and Y2 have positive correlation coefficient.
X and Y3 are not correlated as the correlation coefficient is almost zero.
示例:现在,让我们使用新的数据集继续研究另外两种方法。考虑以下数据集:
使用数据分析
我们还可以分析给定的数据集并计算相关系数:为此,请执行以下步骤:
步骤 1:首先您需要在 Excel 中启用数据分析工具库。启用 :
- 转到 Excel 窗口左上角的File选项卡,然后选择Options 。
- Excel 选项对话框打开。现在转到加载项选项,然后在管理中从下拉列表中选择 Excel 加载项。
- 单击“前往”按钮。
- 加载项对话框打开。在此检查选项Analysis ToolPak 。
- 单击确定!
第 2 步:现在点击数据,然后点击数据分析。将出现一个对话框。
步骤 3:在对话框中,从选项列表中选择相关性。单击确定!
第 4 步:将出现关联菜单。
步骤 5:在此菜单中,首先提供Input Range 。输入范围是 X 和 Y1 列的单元格范围,如下图突出显示。
步骤 6:此外,提供输出范围作为要显示结果的单元格编号。默认情况下,如果您不提供任何输出范围,输出将出现在新的 Excel 工作表中。
第 7 步:检查标签 第一排 选项 如果数据集中有标签。在我们的例子中,第 1 列有标签 X,第 2 列有标签 Y1。
第八步:点击确定。
第 9 步:数据分析表现已准备就绪。在这里,您可以在分析表中看到 X 和 Y1 之间的相关系数。
同样,您可以找到 XY2 和 XY3 的相关系数。最后,所有相关系数为:
使用皮尔逊函数
它与我们在上一节中讨论的 CORREL函数完全相似。 PEARSON函数的语法是:
=PEARSON(array1,array2)
array1 : array of variable x
array2: array of variable y
To insert array1 and array2 just select the cell range for both.
让我们使用 PEARSON函数在示例 2 的数据集中找到 X 和 Y1 的相关系数。
该公式将返回 X 和 Y1 的相关系数。同样,你可以为别人做。
最终的相关系数为: