📅  最后修改于: 2023-12-03 15:38:51.775000             🧑  作者: Mango
PCA(Principal Component Analysis)主成分分析是一种常见的多维数据分析方法,可用于降维和可视化。本文将介绍如何使用 R 语言制作 PCA 图。
首先,我们需要准备一个数据集。这里以鸢尾花数据集为例:
data(iris)
df <- iris[, 1:4]
我们只选取了前四个变量,即花萼长度、花萼宽度、花瓣长度、花瓣宽度。
在进行 PCA 分析之前,需要对数据进行标准化处理,使各变量具有相同的尺度。这可以通过对数据进行均值中心化和标准差缩放来实现。
scaled_df <- scale(df, center = TRUE, scale = TRUE)
接下来,我们使用 prcomp 函数计算主成分。这个函数将返回主成分分析的结果,包括主成分得分、方差解释比例和特征值等信息。
pca <- prcomp(scaled_df)
summary(pca)
最后,我们可以使用 ggbiplot 包来绘制 PCA 图。ggbiplot 提供了一个简单的方法来可视化 PCA 分析结果。
library(ggbiplot)
ggbiplot(pca, obs.scale = 1, var.scale = 1) +
scale_color_discrete(name = '')
这里,我们设置了 obs.scale 和 var.scale 参数为 1,以确保结果在相同的比例下呈现。scale_color_discrete 函数用于将颜色调整为离散值。
library(ggbiplot)
data(iris)
df <- iris[, 1:4]
scaled_df <- scale(df, center = TRUE, scale = TRUE)
pca <- prcomp(scaled_df)
summary(pca)
ggbiplot(pca, obs.scale = 1, var.scale = 1) +
scale_color_discrete(name = '')
以上就是使用 R 制作 PCA 图的全部过程。感谢阅读!