📜  r 中数据帧的列 (1)

📅  最后修改于: 2023-12-03 14:46:52.167000             🧑  作者: Mango

R中数据帧的列

在R中,数据帧是一种非常重要的数据类型。它是由行和列构成的二维矩阵,其中每一列可以包含不同的数据类型,例如字符、数值、逻辑等。对于数据分析师而言,数据帧的列是非常重要和常用的一个概念。因为通过列,我们可以对数据进行筛选、统计、可视化等操作。

获取数据帧的列

在R中,我们可以使用“$”符号或“[ ]”符号获取数据帧的列。下面是一些示例代码:

# 创建数据框
df <- data.frame(姓名=c("张三","李四","王五","小明"), 年龄=c(20,25,18,30), 成绩=c(80,90,70,85))

# 使用$符号获取“年龄”列
df$年龄

# 使用[]符号获取“成绩”列
df["成绩"]

# 使用[]符号获取“姓名”和“年龄”列
df[c("姓名","年龄")]
对数据帧的列进行操作

在R中,我们可以对数据帧的列进行筛选、排序、统计等操作。下面是一些示例代码:

筛选
# 筛选“年龄”大于20岁的行
subset(df, 年龄>20)

# 筛选成绩在80分以上的行,并选取姓名和成绩两列
subset(df, 成绩>=80, select=c("姓名","成绩"))
排序
# 按年龄从小到大排序
df[order(df$年龄),]

# 按成绩从大到小排序,并选取姓名和成绩两列
df[order(df$成绩, decreasing=TRUE), c("姓名","成绩")]
统计
# 计算年龄的平均值
mean(df$年龄)

# 计算成绩的标准差,并保留两位小数
round(sd(df$成绩),2)

# 按姓名分组,计算成绩的平均值和标准差
aggregate(df$成绩, by=list(df$姓名), FUN=function(x) c(mean=mean(x), sd=sd(x)))
总结

数据帧的列是数据分析中非常重要的一个概念。我们可以使用“$”符号或“[ ]”符号获取数据帧的列,然后对其进行筛选、排序、统计等操作。掌握这些操作,将有助于我们更加高效地处理数据。