📅  最后修改于: 2023-12-03 15:09:18.121000             🧑  作者: Mango
在使用 R 进行数据分析时,我们经常需要从数据集中随机选择一部分数据进行分析或建模。本文将介绍 R 中几种常用的随机选择方法。
sample()
函数可以从向量中随机选择指定个数的元素,并返回选择的元素。
# 创建一个包含 1 到 10 的整数向量
x <- 1:10
# 从 x 中随机选择 3 个元素
sample(x, 3)
# 创建一个包含性别和身高数据的数据框
df <- data.frame(
sex = sample(c("male", "female"), 20, replace = TRUE),
height = round(rnorm(20, mean = 170, sd = 5))
)
# 随机选择 5 行
sample_n(df, 5)
# 创建一个包含 1 到 10 的整数向量
x <- 1:10
# 随机排序
x <- sample(x)
# 选择前 3 个元素
x[1:3]
# 数据框已经在上一个示例中创建了
# 随机排序并选择前 5 行
df <- df[sample(nrow(df)), ]
head(df, n = 5)
# 数据框已经在前面创建了
# 随机选择数据框的一部分,占比为 50%
sample_frac(df, 0.5)
# 数据框已经在前面创建了
# 随机选择数据框的 7 行
sample_n(df, 7)
通过以上方法,你可以轻松实现 R 中的随机选择操作。当然,在实际使用时,你需要针对具体情况选择最适合的方法。