如何随机选择 - R 编程语言(1)

📌 相关文章

📜 如何随机选择 - R 编程语言(1)

📅 最后修改于: 2023-12-03 15:09:18.121000 🧑 作者: Mango

如何随机选择 - R 编程语言

在使用 R 进行数据分析时，我们经常需要从数据集中随机选择一部分数据进行分析或建模。本文将介绍 R 中几种常用的随机选择方法。

1. sample() 函数

sample() 函数可以从向量中随机选择指定个数的元素，并返回选择的元素。

1.1 随机选择向量中的元素

# 创建一个包含 1 到 10 的整数向量
x <- 1:10

# 从 x 中随机选择 3 个元素
sample(x, 3)

1.2 随机选择数据框中的行

# 创建一个包含性别和身高数据的数据框
df <- data.frame(
  sex = sample(c("male", "female"), 20, replace = TRUE),
  height = round(rnorm(20, mean = 170, sd = 5))
)

# 随机选择 5 行
sample_n(df, 5)

2. 随机排序并选择

2.1 随机排序向量

# 创建一个包含 1 到 10 的整数向量
x <- 1:10

# 随机排序
x <- sample(x)

# 选择前 3 个元素
x[1:3]

2.2 随机排序数据框中的行

# 数据框已经在上一个示例中创建了

# 随机排序并选择前 5 行
df <- df[sample(nrow(df)), ]
head(df, n = 5)

3. 抽样函数

3.1 抽样函数 sample_frac()

# 数据框已经在前面创建了

# 随机选择数据框的一部分，占比为 50%
sample_frac(df, 0.5)

3.2 抽样函数 sample_n()

# 数据框已经在前面创建了

# 随机选择数据框的 7 行
sample_n(df, 7)

通过以上方法，你可以轻松实现 R 中的随机选择操作。当然，在实际使用时，你需要针对具体情况选择最适合的方法。