如何在 R 中执行单变量分析?
在本文中,我们将讨论如何在 R 编程语言中执行单变量分析。单变量分析意味着对一个变量进行分析。
汇总统计
汇总统计数据包括:
- 最小值 -获取最小值元素
语法:
min(data)
- 最大值 -获取最大值元素
语法:
max(data)
- 平均值 -获取给定元素的平均值
语法:
mean(data)
- 中位数 -获取给定元素的中位数
语法:
median(data)
- 四分位间距 –获取给定元素的 IQR
语法:
IQR(data)
- 标准偏差 -获取给定元素的标准偏差
句法:
sd(data)
- Range –从元素中获取范围
语法:
max(data)-min(data)
示例:R 程序创建一个包含 10 个元素的向量并显示汇总统计信息。
R
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# minimum
print(min(data))
# maximum
print(max(data))
# mean
print(mean(data))
# median
print(median(data))
# IQR
print(IQR(data))
# range
print(max(data)-min(data))
# standard deviation
print(sd(data))
R
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display frequency table
print(table(data))
R
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display boxplot
print(boxplot(data))
R
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display histogram
print(hist(data))
R
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display density plot
print(plot(density(data)))
输出:
[1] 1 2 3 4 5 6 7 8 9 10
[1] 1
[1] 10
[1] 5.5
[1] 5.5
[1] 4.5
[1] 9
[1] 3.02765
频率表
我们可以使用 table() 方法显示频率表,这将返回元素出现的计数。
语法:
table(data)
示例:
R
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display frequency table
print(table(data))
输出:
可视化
在这里,我们可以使用一些图来可视化数据
箱形图
boxplot()函数将产生一个五点摘要(最小值、最大值、中值、第一个四分位数、第三个四分位数)
语法:
boxplot(data)
示例:
R
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display boxplot
print(boxplot(data))
输出:
[1] 1 2 3 4 5 6 7 8 9 10
$stats
[,1]
[1,] 1.0
[2,] 3.0
[3,] 5.5
[4,] 8.0
[5,] 10.0
attr(,"class")
1
"integer"
$n
[1] 10
$conf
[,1]
[1,] 3.001801
[2,] 7.998199
$out
numeric(0)
$group
numeric(0)
$names
[1] "1"
输出:
直方图
这将返回数据的直方图,使用的函数是 hist()
语法:
hist(data)
示例:
R
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display histogram
print(hist(data))
输出:
[1] 1 2 3 4 5 6 7 8 9 10
$breaks
[1] 0 2 4 6 8 10
$counts
[1] 2 2 2 2 2
$density
[1] 0.1 0.1 0.1 0.1 0.1
$mids
[1] 1 3 5 7 9
$xname
[1] "data"
$equidist
[1] TRUE
attr(,"class")
[1] "histogram"
输出:
密度图
这将显示密度图。我们必须使用 density()函数和 plot()函数。
语法:
plot(density(data))
示例:
R
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display density plot
print(plot(density(data)))
输出:
[1] 1 2 3 4 5 6 7 8 9 10
NULL