📅  最后修改于: 2023-12-03 15:04:45.931000             🧑  作者: Mango
在R中,数据框是一种常用的数据结构,也是R中用于数据处理和分析的核心。因此,对于数据框的摘要统计和描述是R编程中必不可少的一部分。
dim()
dim()
函数可以返回数据框的行数和列数,例如:
dim(iris) # 返回 150 5,表示iris数据框有150行和5列
names()
names()
函数可以返回数据框每一列的列名,例如:
names(iris) # 返回 "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species"
str()
str()
函数可以返回数据框的基本结构信息,例如每一列的变量类型和前几行数据的样式,例如:
str(iris) # 返回数据框结构信息
输出结果为:
'data.frame': 150 obs. of 5 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
summary()
summary()
函数可以返回每一列的统计摘要信息,例如每一列的最大值、最小值、中位数、平均值等等,例如:
summary(iris) # 返回每一列的统计摘要信息
输出结果为:
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setosa :50
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50
Median :5.800 Median :3.000 Median :4.350 Median :1.300 virginica :50
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
head()
head()
函数可以返回数据框的前几行,例如:
head(iris) # 返回iris数据框的前6行数据
输出结果为:
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
tail()
tail()
函数可以返回数据框的后几行,例如:
tail(iris) # 返回iris数据框的后6行数据
输出结果为:
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
145 6.7 3.3 5.7 2.5 virginica
146 6.7 3.0 5.2 2.3 virginica
147 6.3 2.5 5.0 1.9 virginica
148 6.5 3.0 5.2 2.0 virginica
149 6.2 3.4 5.4 2.3 virginica
150 5.9 3.0 5.1 1.8 virginica
以上就是关于R中数据框摘要统计和描述的介绍,包括dim()
、names()
、str()
、summary()
、head()
、tail()
等常用函数,这些函数可以帮助我们更好地理解数据框的结构和数据特征,从而更好地进行数据处理和分析。