📜  绘制两个变量 - R 编程语言(1)

📅  最后修改于: 2023-12-03 15:11:38.778000             🧑  作者: Mango

绘制两个变量 - R 编程语言

在数据分析和统计学中,经常需要对两个变量之间的关系进行可视化。R 编程语言提供了多种绘制两个变量关系的方法,本篇文章将介绍其中常用的方法包括散点图、线性回归图和热力图等。

散点图

散点图是展示两个连续变量之间关系最常用最简单的方法。使用 plot() 函数即可绘制散点图,例如:

set.seed(111)
x <- rnorm(100)
y <- x + rnorm(100, sd = 0.5)
plot(x, y, main = "Scatterplot Example", xlab = "X", ylab = "Y")

运行以上代码,将会得到一个散点图,其中 X 轴表示变量 X 的值,Y 轴表示变量 Y 的值,每个点表示对应 X,Y 值的一组数据。

scatterplot

线性回归图

线性回归图用于检验两个变量的线性关系,可以使用 lm() 函数计算线性回归系数和截距,并用 abline() 函数在散点图上绘制线性回归线,例如:

lm_fit <- lm(y ~ x)
plot(x, y, main = "Linear Model Example", xlab = "X", ylab = "Y")
abline(lm_fit, col = "red")

运行以上代码,将会得到一个带有回归线的散点图。其中,红色线条表示的是通过计算线性回归关系得到的回归线。

linear_model

热力图

热力图用于展示二维数据的密度分布,颜色编码可以反映数据的值。在 R 中,我们可以使用 ggplot2 包绘制热力图,例如:

library(ggplot2)
z <- matrix(rnorm(400), nrow = 20, ncol = 20)
colnames(z) <- rownames(z) <- NULL
df <- reshape2::melt(z)
ggplot(df, aes(x = Var1, y = Var2, fill = value)) +
  geom_tile() +
  scale_fill_gradient(low = "white", high = "blue") +
  theme(axis.text.x = element_blank(),
        axis.text.y = element_blank(),
        axis.title.x = element_blank(),
        axis.title.y = element_blank())

以上代码将会得到一个简单的热力图,其中黑色表示数据值较小,蓝色表示数据值较大。

heatmap

总结

本文介绍了在 R 编程语言中绘制两个变量关系的三种方法,包括散点图、线性回归图和热力图。上述方法仅是其中比较基础的方法,R 还提供了更多高级绘图工具供开发者使用,希望本文能够给大家提供一些绘图思路和实践经验。