📜  在 R 编程中创建数据框的子集——subset()函数(1)

📅  最后修改于: 2023-12-03 15:07:47.979000             🧑  作者: Mango

在 R 编程中创建数据框的子集——subset()函数

在 R 编程中,subset()函数用于从数据框中提取符合一定条件的行或列。本文将介绍subset()函数的使用方法。

基本语法

subset()函数的基本语法如下:

subset(x, subset, select, drop = FALSE)

其中,

  • x:数据框对象;
  • subset:一个逻辑条件表达式,用于筛选行;
  • select:有哪些列需要保留,可以是列名或列的位置;
  • drop:一个逻辑值,如果为TRUE,则删除维度为1的维度。
例子

接下来我们将使用subset()函数来筛选一个数据框的子集,如下所示:

# 首先创建数据框
df <- data.frame(
  name = c("Tom", "Jerry", "Mickey", "Minnie"),
  age = c(25, 30, 20, 22),
  gender = c("M", "M", "M", "F"),
  height = c(170, 175, 160, 165)
)

# 然后用subset()函数提取符合条件的子集
sub_df <- subset(df, age > 20 & gender == "M", select = c("name", "height"))
sub_df

该代码将返回以下子集:

     name height
1     Tom    170
2   Jerry    175
3  Mickey    160

这是一个只包含男性,且年龄大于20岁的子集,只包含name和height列。

注意事项

需要注意的是,subset()函数创建的子集是原始数据框的副本,不会影响原始数据框。另外,如果副本为空,则subset()函数将返回一个元素个数为0的数据框。

结论

在 R 编程中,subset()函数是很有用的函数之一,能够帮助程序员从数据框中提取符合条件的行或列。希望通过本文的介绍能够提高大家使用R编程的效率。