📝 统计教程
490篇技术文档📅  最后修改于: 2021-01-23 06:27:42        🧑  作者: Mango
具有自由度的卡方分布(卡方或$ {X ^ 2} $-分布),k是k个独立标准正态随机变量的平方和的分布。它是统计中使用最广泛的概率分布之一。这是伽马分布的特例。卡方分布被统计人员广泛用于计算以下内容:使用样本标准偏差来估计正态分布的总体标准偏差的置信区间。检查两个定性变量的两个分类标准的独立性。检查类别变量之间的关系。在基础分布为正态的情况下研究样本方差。测试预期频率与观察频率之间的差异偏差。进行...
📅  最后修改于: 2021-01-23 06:28:08        🧑  作者: Mango
表格中的数字代表$ {\ chi ^ 2} $统计信息的值。阴影区域(A)的区域是列索引。您还可以使用卡方分布来精确计算临界值和p值。dfA=0.0050.0100.0250.050.100.250.500.750.900.950.9750.990.99510.0000390.000160.000980.00390.01580.1020.4551.322.713.845.026.637.8820....
📅  最后修改于: 2021-01-23 06:28:23        🧑  作者: Mango
圆排列是可将n个不同的对象围绕固定圆排列的方式的总数。它有两种类型。情况1:-顺时针和逆时针顺序不同。情况2:-顺时针和逆时针顺序相同。情况1:公式$ {P_n =(n-1)!} $哪里-$ {P_n} $ =表示循环排列$ {n} $ =对象数情况2:公式$ {P_n = \ frac {n-1!} {2!}} $哪里-$ {P_n} $ =表示循环排列$ {n} $ =对象数例问题陈述:考虑i...
📅  最后修改于: 2021-01-23 06:28:46        🧑  作者: Mango
在簇抽样中,理想情况下,元素在本质上是异质的,并且是随机选择的。与分层抽样不同的是,分层抽样的组是同质的,很少从每个组中随机选择元素,而在集群抽样中,具有组内异质性的组得到了发展,并且组内的所有元素都成为样本的一部分。分层抽样具有组内同质性和组间异质性,而集群抽样具有组内异质性。例子一阶段集群采样由来自不同部门的成员组成的委员会具有高度的异质性。当从这样的委员会的数目中,很少是随机选择的,那么就是...
📅  最后修改于: 2021-01-23 06:29:06        🧑  作者: Mango
科恩的kappa系数是一种统计数据,用于衡量定性(分类)项目的评估者之间的一致性。通常认为它比简单的百分比协议计算更为可靠,因为k考虑了偶然发生的协议。科恩的kappa度量两个评估者之间的协议,每个评估者将N个项目分为C个互斥类别。科恩的卡伯系数由以下函数定义和给出:式$ {k = \ frac {p_0-p_e} {1-p_e} = 1-\ frac {1-p_o} {1-p_e}} $哪里-$...
📅  最后修改于: 2021-01-23 06:29:22        🧑  作者: Mango
组合是对一组对象的全部或部分的选择,而与选择对象的顺序无关。例如,假设我们有一组三个字母:A,B和C。我们可能会问我们可以从该组中选择2个字母的方式有多少种。组合由以下函数定义和给出:式$ {C(n,r)= \ frac {n!} {r!(nr)!}} $哪里-$ {n} $ =要选择的对象数。$ {r} $ =所选对象的数量。例问题陈述:老师可以从15名学生的教室中选择多少个10名学生的组?解:...
📅  最后修改于: 2021-01-23 06:29:36        🧑  作者: Mango
排列或排列一组或多个事物的几种可能方式中的每一种都称为置换。概率替换与组合是从无序列表中多次选择一个对象。与替换的组合由以下概率函数定义并给出:式$ {^ nC_r = \ frac {(n + r-1)!} {r!(n-1)!}} $哪里-$ {n} $ =可以选择的项目数。$ {r} $ =所选项目数。$ {^ nC_r} $ =项目或组合的无序列表例问题陈述:冷冻酸奶有五种:香蕉,巧克力,柠...
📅  最后修改于: 2021-01-23 06:29:52        🧑  作者: Mango
可以使用箱形图和晶须图比较人口群体。总体可见范围和中位数之间的差异用于得出结论,即两组之间是否存在差异。情况2:公式$ {P = \ frac {DBM} {OVS} \ times 100} $哪里-$ {P} $ =百分比差异$ {DBM} $ =中位数之间的差异。$ {OVS} $ =可见的整体价差。规则对于30个样本,如果该百分比大于33%,则两组之间往往会有差异。对于100的样本量,如果...
📅  最后修改于: 2021-01-23 06:30:08        🧑  作者: Mango
连续均匀分布是从a和b之间的连续间隔中随机数选择的概率分布。其密度函数由以下定义。这是a = 1,b = 3时的连续均匀分布图。式f(x)= \ begin {cases} 1 /(ba),&\ text {当$ a \ le x \ le b $} \\ 0,&\ text {当$ x \ lt a $或$ x \ gt b $} \ end {cases}例问题陈述:假设您正在领导测试,并向2...
📅  最后修改于: 2021-01-23 06:30:22        🧑  作者: Mango
累积频率定义为运行频率的总和。集合中元素的频率是指集合中该元素有多少个。累积频率也可以定义为直到当前点的所有先前频率的总和。例问题陈述:下面的数据集显示了某个冬令营参与者的年龄。绘制数据的累积频率表。Age (years)Frequency1031118121313121471527解:通过将当前点的频率与前一点的累积频率相加,可以找到某个点的累积频率。第一个数据点的累积频率与其频率相同,因为它之...
📅  最后修改于: 2021-01-23 06:30:39        🧑  作者: Mango
变异系数标准偏差是色散的绝对度量。当必须在两个系列之间进行比较时,则使用色散的相对度量,即变异系数。变异系数CV由以下函数定义和给出:式$ {CV = \ frac {\ sigma} {X} \ times 100} $哪里-$ {CV} $ =变异系数。$ {\ sigma} $ =标准差。$ {X} $ =平均值。例问题陈述:从以下数据。识别风险项目,风险更大:Year12345Projec...
📅  最后修改于: 2021-01-23 06:30:56        🧑  作者: Mango
相关系数相关系数是一个变量的值变化预测另一值的变化程度的统计量度。在正相关变量中,该值串联增加或减小。在负相关变量中,一个值随着另一个值的减小而增加。相关系数表示为+1和-1之间的值。系数+1表示完美的正相关:一个变量值的变化将预测第二个变量在同一方向上的变化。系数-1表示完美的负数:一个变量值的变化预示着第二个变量在相反方向上的变化。较小的相关度表示为非零的小数。系数为零表示变量波动之间没有可辨...
📅  最后修改于: 2021-01-23 06:31:13        🧑  作者: Mango
累积图是一种以图形方式绘制累积信息的方法。它显示小于或等于特定值的观察值的数量/百分比或比例。例问题陈述:根据以下数据绘制10个学生考试成绩的频率和交流频率图。Sr. No.Roll No.Test Score1100302101403102354103505104606105657105358105559105651010570解:对于频率图,计算频率,如下所示。此表显示编号。在给定范围内得分的...
📅  最后修改于: 2021-01-23 06:31:28        🧑  作者: Mango
$ {\ lambda} $是shape参数,它指示给定时间间隔内的平均事件数。以下是$ {\ lambda} $四个值的泊松概率密度函数的图。累积分布函数。式$$ {F(x,\ lambda)= \ sum_ {k = 0} ^ x \ frac {e ^ {-\ lambda} \ lambda ^ x} {k!}} $$哪里-$ {e} $ =自然对数的底数等于2.71828$ {k} $ ...
📅  最后修改于: 2021-01-23 06:32:38        🧑  作者: Mango
研究所需的数据本质上可以是主要的或辅助的。从定义上讲,主要数据是研究人员专门为解决近期人口而直接收集的日期。调查研究本质上可以是客观主义或主观主义。客观主义的方法是一种更僵化和科学的方法。在此假设是使用公开标准程序检验的。没有什么余地或没有余地可以偏离规定的程序或问题。主观主义的方法需要进行假设检验,但在遵循程序上并不那么严格。研究人员可以自行决定使用非结构化方法来记录数据。研究数据可以分类如下:...