📅  最后修改于: 2023-12-03 15:07:47.993000             🧑  作者: Mango
在 R 编程中,我们经常需要对一些数据进行统计和分析,并以表格形式来展示这些数据。其中,table() 函数就是 R 中用于创建数据的表格表示的函数之一。
table() 函数的基本语法如下:
table(..., dnn = list.names, exclude = if (useNA == "no") c(NA, NaN),
useNA = c("no", "ifany", "always"), deparse.level = 1)
其中:
...
:一个或多个用来创建表格的变量。dnn
:一个字符向量,用于指定创建表格时每个变量的名称。默认情况下,每个变量名称由相应变量的名称或变量本身自动生成。exclude
:一个向量,用于指定要排除的值。useNA
:一个字符向量,指定如何处理缺失值(NA)。可选值包括 "no"(排除 NA)、"ifany"(如果有 NA,则包括 NA)和 "always"(总是包括 NA)。deparse.level
:一个整数,指定要返回的结果的复杂程度。下面通过一个实例来演示 table() 函数的用法。
首先,我们需要准备一个包含若干观察数据的数据集。这里我们使用 R 中自带的 iris 数据集。
data(iris)
head(iris)
输出结果如下:
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
接着,我们使用 table() 函数创建一个表格,统计 iris 数据集中各物种的数量。
table(iris$Species)
输出结果如下:
setosa versicolor virginica
50 50 50
表格中的每行对应一种物种,第一列是每种物种的名称,第二列是对应的数量。
我们还可以使用 table() 函数按照多个条件来统计数据,如下所示:
table(iris$Species, iris$Petal.Width)
输出结果如下:
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2 2.3 2.4 2.5
setosa 1 29 14 6 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
versicolor 0 0 0 0 0 0 0 0 0 7 10 11 6 7 1 2 0 0 0 0 0 0 0 0 0
virginica 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 3 8 3 2 4 1 1 1
这个表格中有两个条件,第一行表示物种名称,第一列表示花瓣宽度。每个单元格中显示的是满足这两个条件的观察值的数量。
通过 table() 函数,我们可以轻松地创建数据的表格表示,用于数据的统计和分析。在使用时,需要注意指定合适的变量和参数,以获得准确的数据表格。