使用 Dplyr 在 R 中选择随机样本
在本文中,我们将研究从 R 编程语言的 Dplyr 包中选择随机样本的不同方法。
使用R编程语言安装和导入Dplyr包,用户需要遵循以下语法:
句法:
install.packages(“dplyr”)
library(dplyr)
方法一:使用Sample_n()函数
Sample_n()函数用于从 R 中的数据帧中选择 n 个随机行。这是 R 编程语言中广泛使用的函数之一,因为该函数用于测试各种用户构建模型以实现预测和准确性目的。
Syntax: sample_n(tbl, size, replace, fac, …)
Parameters:
- tbl: a Momocs object (Coo, Coe)
- size: numeric how many shapes should we sample
- replace: logical whether the sample should be done with or without replacement
- fac: a column name if a $fac is defined; size is then applied within levels of this factor
- …: additional arguments to dplyr::sample_n and to maintain generic compatibility
Return:
This function will be returning the random samples from the provided data of size n.
示例:使用 sample_n() 生成随机样本的 R 程序
R
library(dplyr)
gfg_data <- iris
sample_n(gfg_data,10)
R
library(dplyr)
gfg_data <- iris
sample_frac(gfg_data,0.065)
输出:
方法 2:使用Sample_frac()函数
Sample_frac()函数从数据帧或表中随机选择 n 百分比的行,该函数的使用类似于 sample_n()函数,该函数在 R 编程语言中被广泛使用。
Syntax: sample_frac(tbl, size, replace, fac, …)
Parameters:
- tbl: a Momocs object (Coo, Coe)
- size: numeric (0 < numeric <= 1) the fraction of shapes to select
- replace: logical whether the sample should be done with or without replacement
- fac: a column name if a $fac is defined; size is then applied within levels of this factor
- …: additional arguments to dplyr::sample_frac and to maintain generic compatibility
示例:使用 sample_frac() 生成随机样本的 R 程序
电阻
library(dplyr)
gfg_data <- iris
sample_frac(gfg_data,0.065)
输出: