📜  R 中的直方图和密度图(1)

📅  最后修改于: 2023-12-03 15:04:45.464000             🧑  作者: Mango

R中的直方图和密度图

在数据分析中,我们经常需要对数据分布进行可视化分析,以便更好地理解数据。R语言中提供了许多种数据可视化的方式,其中直方图和密度图是常用的两种方式。本文将介绍如何使用R中的直方图和密度图进行数据可视化。

直方图

直方图(Histogram)是一种展示数据分布情况的图表,它将数据分成若干个区间,每个区间的频数或频率表示在该区间内的数据数量或概率。直方图可以用于展示连续变量或离散变量的分布情况。在R语言中,可以使用hist()函数绘制直方图。

绘制基础直方图
# 生成正态分布随机数据
data <- rnorm(1000)

# 绘制直方图,默认bin宽度为自适应
hist(data)

修改直方图参数

hist()函数中可以修改的参数有很多,下面列举常用的几个:

  • breaks:指定直方图分割的区间数量或区间边界值
  • main:添加主标题
  • xlab:添加x轴标签
  • ylab:添加y轴标签
  • col:指定柱子填充颜色
  • border:指定柱子边框颜色
  • lwd:指定柱子边框宽度
  • freq:设置为FALSE表示按概率密度绘制直方图
# 生成正态分布随机数据
data <- rnorm(1000)

# 绘制直方图,设置分割区间数、添加标题和标签、设置柱子颜色和边框
hist(data, breaks = 30, main = "Normal Distribution", xlab = "Data Value",
     ylab = "Frequency", col = "steelblue", border = "white", lwd = 1)

密度图

密度图(Density Plot)是一种展示数据分布情况的图表,它是利用概率密度函数估计样本的概率密度,进而反映数据的分布情况。密度图可以用于展示连续变量的分布情况。在R语言中,可以使用density()函数计算密度函数,使用plot()函数绘制密度图。

绘制基础密度图
# 生成正态分布随机数据
data <- rnorm(1000)

# 计算密度函数
dens <- density(data)

# 绘制密度图
plot(dens, main = "Density Plot", xlab = "Data Value", ylab = "Density", 
     col = "steelblue", lwd = 2)

修改密度图参数

plot()函数中可以修改的参数有很多,下面列举常用的几个:

  • main:添加主标题
  • xlab:添加x轴标签
  • ylab:添加y轴标签
  • col:指定曲线颜色
  • lwd:指定曲线宽度
  • type:指定绘制类型,"l"表示绘制线条,"p"表示绘制点
# 生成正态分布随机数据
data <- rnorm(1000)

# 计算密度函数
dens <- density(data)

# 绘制密度图,添加标题和标签,设置曲线颜色和宽度,并绘制点
plot(dens, main = "Density Plot", xlab = "Data Value", ylab = "Density", 
     col = "steelblue", lwd = 2, type = "l", pch = 20, cex = 0.5)

通过比较直方图和密度图,我们可以看出它们都能很好的展示数据分布情况,但密度图更能反映数据的分布趋势。在选择使用哪种方式进行数据可视化时,需要根据实际情况选择合适的方式。