📅  最后修改于: 2023-12-03 15:06:32.317000             🧑  作者: Mango
在 R 语言中,可以很方便地使用 cor()
函数来计算相关系数矩阵。相关矩阵是由两个变量之间的相关系数组成的矩阵,其中每一行和每一列对应一个变量。
在创建相关矩阵之前,需要先确保数据集中的变量都是相同数据类型的。例如,如果数据集中既有数值类型的变量,也有字符类型的变量,那么就需要将字符类型的变量转换为数值类型的变量,以避免出现错误。
下面是一个示例代码片段,演示如何使用 cor()
函数从 R 中相同数据类型的 DataFrame 创建相关矩阵。这里使用了内置数据集 iris
,该数据集包含了 3 种不同类型的鸢尾花的测量数据。
# 加载内置数据集 iris
data(iris)
# 提取第 1 列到第 4 列作为特征变量
features <- iris[, 1:4]
# 计算相关系数矩阵
corr_matrix <- cor(features)
# 打印相关矩阵
print(corr_matrix)
输出结果如下所示:
Sepal.Length Sepal.Width Petal.Length Petal.Width
Sepal.Length 1.0000000 -0.1175698 0.8717538 0.8179411
Sepal.Width -0.1175698 1.0000000 -0.4284401 -0.3661259
Petal.Length 0.8717538 -0.4284401 1.0000000 0.9628654
Petal.Width 0.8179411 -0.3661259 0.9628654 1.0000000
从上面的输出结果可以看到,相关矩阵的每一行和每一列都代表一个特征变量,每个元素代表两个特征变量之间的相关系数。例如,第一行第一列的元素 1.0000000 表示 Sepal.Length 与 Sepal.Length 之间的相关系数为 1,即完全相关。而第一行第二列的元素 -0.1175698 表示 Sepal.Length 与 Sepal.Width 之间的相关系数为 -0.1175698,即负相关。