📜  R – 数据帧操作(1)

📅  最后修改于: 2023-12-03 15:04:45.300000             🧑  作者: Mango

R – 数据帧操作

在R语言中,数据帧(Data Frames)是一种常见和流行的数据结构,用于存储和处理多维数据。数据帧类似于Excel电子表格中的数据表,具有行和列的结构。

创建数据帧

可以通过多种方式创建数据帧。以下是一些常见的方法:

1. 手动创建数据帧

可以使用data.frame()函数手动创建数据帧。可以通过向函数传递向量或列表来指定列的值。

# 创建数据帧
df <- data.frame(
  name = c("John", "Jane", "Mike"),
  age = c(25, 32, 28),
  gender = c("M", "F", "M"),
  stringsAsFactors = FALSE
)

# 显示数据帧
df
2. 从文件加载数据帧

可以从文件(如CSV文件)加载数据帧。可以使用read.csv()read.table()函数读取文件中的数据。

# 从CSV文件加载数据帧
df <- read.csv("data.csv")

# 显示数据帧
df
数据帧操作

现在我们将学习如何操作数据帧。

查看数据帧

可以使用以下函数来查看数据帧的内容:

  • head(df) - 显示数据帧的前几行,默认显示前6行。
  • tail(df) - 显示数据帧的后几行,默认显示后6行。
  • str(df) - 显示数据帧的结构信息,包括列名、数据类型等。
选择列

可以使用以下方式选择数据帧中的列:

# 使用$操作符选择列
df$name

# 使用列索引选择列
df[, 1]

# 使用列名选择列
df[["name"]]
选择行

可以使用以下方式选择数据帧中的行:

# 使用行索引选择行
df[1, ]

# 使用逻辑条件选择行
df[df$age > 30, ]
添加列

可以通过给数据帧新增列来添加新的数据:

# 添加新列
df$city <- c("New York", "London", "Paris")

# 显示更新后的数据帧
df
删除列

可以使用以下方式删除数据帧中的列:

# 删除列
df$city <- NULL

# 显示更新后的数据帧
df
修改列名

可以使用以下方式修改数据帧中的列名:

# 修改列名
colnames(df)[1] <- "full_name"

# 显示更新后的数据帧
df
根据条件筛选行

可以使用以下方式根据条件筛选数据帧中的行:

# 根据条件筛选行
subset_df <- subset(df, age > 30)

# 显示筛选后的数据帧
subset_df
汇总统计

可以使用以下方式对数据帧进行汇总统计:

# 计算均值
mean_age <- mean(df$age)

# 计算总和
total_age <- sum(df$age)

# 显示结果
mean_age
total_age

以上只是数据帧操作的一些基本方法。R语言提供了丰富的函数和操作符,可以进行更多高级的数据帧操作。详细了解这些函数和操作符可以参考R的官方文档或其他相关资料。

希望这份介绍对你了解和使用R语言中的数据帧操作有所帮助!