📜  统计-简单随机抽样

📅  最后修改于: 2021-01-23 06:54:30             🧑  作者: Mango


一个简单的随机样本定义为一个样本,其中总体的每个元素都有平等且独立的机会被选中。对于具有N个单位的总体,选择N个样本单位以及N C n个样本的所有可能组合的概率由1 / N C n给出。例如,如果我们有五个元素(A,B,C, D,E)即N 5,我们想要一个大小为n = 3的样本,那么就有5 C 3 = 10个可能的样本,并且任何单个单位成为样本成员的概率为1/10。

简单的随机抽样可以两种不同的方式完成,即“有替换”或“无替换”。当在下一次抽奖之前更换选定的单元之后,将这些单元连续选择到样本中时,它是带有替换的简单随机样本。如果选择的单位在下一次绘制之前不被替换,并且仅从总体的剩余单位中绘制连续的单位,则称为简单随机样本而无需替换。因此,在前一种方法中,可以重复选择一次的单位,而在后一种方法中,不重复选择一次的单位。由于与无需替换的简单随机样本相关的统计效率更高,因此它是首选方法。

一个简单的随机样本可以通过两种方法中的一种来抽取,即通过抽奖方法或随机数表。

  • 抽奖方法-在这种方法下,将根据随机抽奖选择单位。首先,人口中的每个成员或元素都分配有唯一的编号。下一步,将这些数字写在形状,大小,颜色等物理相似的单独卡上。然后将它们放在篮子中并充分混合。在最后一步中,不看它们就随机取出纸条。抽签的数量等于所需的样本数量。

    彩票方法几乎没有缺点。编写N张纸条的过程非常繁琐,并且很难对人口规模非常大的大量纸条进行改组。选择纸条时,人为的偏见也会进入。因此,可以使用另一种选择,即随机数。

  • 随机数表方法-这些由随机准备的数字列组成。可以使用随机表的数量,例如Fisher和Yates表,Tippets随机数等。下面列出的是Fisher&Yates表中两位数字的随机数的序列:

    61、44、65、22、01、67、76、23、57、58、54、11、33、86、07、26、75、76、64、22、19、35、74、49、86, 58,69,52,27,34,91,25,34,67,76,73,27,16,53,18,19,69,32,52,38,72,38,64,81,79和38。

    第一步涉及为人口的每个成员分配一个唯一的数字,例如,如果人口由20个人组成,则所有个人的编号都从01到20。如果我们要收集5个单位的样本,请参考随机数表5选择两位数。例如,使用上表,具有以下五个数字的单位将构成一个样本:01、11、07、19和16。如果采样没有替换且特定的随机数重复了,那么它将不再被使用,而下一个将选择符合我们标准的编号。

因此,可以使用两个过程中的任何一个来绘制简单的随机样本。然而,在实践中,已经看到简单的随机样本涉及大量的时间和精力,并且是不切实际的。