📜  如何随机选择 - R 编程语言(1)

📅  最后修改于: 2023-12-03 15:09:18.121000             🧑  作者: Mango

如何随机选择 - R 编程语言

在使用 R 进行数据分析时,我们经常需要从数据集中随机选择一部分数据进行分析或建模。本文将介绍 R 中几种常用的随机选择方法。

1. sample() 函数

sample() 函数可以从向量中随机选择指定个数的元素,并返回选择的元素。

1.1 随机选择向量中的元素
# 创建一个包含 1 到 10 的整数向量
x <- 1:10

# 从 x 中随机选择 3 个元素
sample(x, 3)
1.2 随机选择数据框中的行
# 创建一个包含性别和身高数据的数据框
df <- data.frame(
  sex = sample(c("male", "female"), 20, replace = TRUE),
  height = round(rnorm(20, mean = 170, sd = 5))
)

# 随机选择 5 行
sample_n(df, 5)
2. 随机排序并选择
2.1 随机排序向量
# 创建一个包含 1 到 10 的整数向量
x <- 1:10

# 随机排序
x <- sample(x)

# 选择前 3 个元素
x[1:3]
2.2 随机排序数据框中的行
# 数据框已经在上一个示例中创建了

# 随机排序并选择前 5 行
df <- df[sample(nrow(df)), ]
head(df, n = 5)
3. 抽样函数
3.1 抽样函数 sample_frac()
# 数据框已经在前面创建了

# 随机选择数据框的一部分,占比为 50%
sample_frac(df, 0.5)
3.2 抽样函数 sample_n()
# 数据框已经在前面创建了

# 随机选择数据框的 7 行
sample_n(df, 7)

通过以上方法,你可以轻松实现 R 中的随机选择操作。当然,在实际使用时,你需要针对具体情况选择最适合的方法。