统计学中有哪些重要的公式?
统计学是科学的一个分支,用于数据收集、评估和总结。它以数学格式总结数据。统计主要用于了解数据并关注各种应用。它用于收集有关使用数字集指定的数据集的事实和数据。数理统计应用数学技术,如线性代数、微分方程、数学分析和概率论。
在大规模使用的数理统计中,有两种分析数据的方法:
- 描述性统计
- 推论统计
统计中使用的一些重要公式
意思是
也称为算术平均值,它是通过计算给定一组数字的平均值来计算的。它是所有给定数据值的总和除以集合中给定的数据值的总数。计算方式如下:
平均公式
给定数据集的平均值由以下公式指定,
where,
- x̄ = the mean value of the set of given data.
- f = frequency of each class
- x = mid-interval value of each class
因此,所有数据点的平均值称为均值。
中位数
给定数字集的中位数被计算为最中间的观察值。该值是对数据进行升序排列后得到的。数据的中位数是数据集中趋势的量度,因此可用于数据分析。中位数也称为地方平均值,是一个易于计算的指标。它是放置在指定数据序列中间的数据。
中位数公式
为了找到数据集的中位数,首先将数字按升序排列。然后从以下计算中间值。
奇数个观察值
如果数据集中包含的观察总数为奇数,则中位数公式如下:
where n is the number of observations
偶数观察
如果数据集中包含的观测总数为偶数,则中位数公式如下:
where, n is the number of observations
模式
在统计数据分析中,给定数据集的众数是给定值集中重复出现的值。它对应于出现最大次数的值。它是其他数字集中频率最高的值。
它是出现次数最多的值。
例如,在给定的一组数字中:8、9、10、10、5、10,给定的整数数据集的众数为 10,因为它出现的次数最多,即 3 次。
未分组数据的众数公式
未分组数据的计算需要按升序或降序排列数据值。然后找到并捕获重复值及其频率。现在,以最高频率捕获的观测值是给定数据的模态值。这是计算的模态值。
分组数据的众数公式
In this formula, we have,
- I0 is the lower limit of the modal class
- h is the size of the class interval
- f1 is the frequency of the modal class
- f0 is the frequency of the class preceding the modal class
- f2 is the frequency of the class succeeding the modal class
标准差
标准偏差是对形成数据集的值的分散程度的度量。它是相对于其相应值的散射测量。
它用于描述性统计。它是衡量数据点与数据点平均值的变化的指标。样本的标准偏差计算为其方差的平方根。
标准差公式
总体标准差
In this formula, we have,
- σ = Population standard deviation
- N = Number of observations in population
- Xi = ith observation in the population
- μ = Population mean
样本标准差
In this formula, we have,
- s = Sample standard deviation
- n = Number of observations in sample
- xi = ith observation in the sample
- = Sample mean
方差
数据分布的方差是衡量数据点与均值的差异程度。它是衡量一组数字与其相应平均值相差多少的指标。数据的方差被认为是标准差的两倍。
它用于计算与实际值偏差的预期差异。方差取决于观测值的指定数据集的标准差。这意味着如果方差越大,数据值与均值的分布越广,同样,如果方差越小,数据值与均值的分布就越小。因此,它从数据集的平均值测量数据的分散性。
方差公式
人口差异
In this formula, we have,
- σ = Population standard deviation
- N = Number of observations in population
- Xi = ith observation in the population
- μ = Population mean
样本方差
In this formula, we have,
- s = Sample standard deviation
- n = Number of observations in sample
- xi = ith observation in the sample
- = Sample mean
示例问题
问题 1. 求 100 名学生的班级考试成绩的平均值
99, 95, 87, 55, 72, 86, 92, 89, 75, 88
解决方案:
To find the mean of the data first we need to find the sum of all the marks of students
Sum of observations = 99+95+87+55+72+86+92+89+75+88 = 838
Number of observations = 10
Therefore,
= 83.8
Therefore,
Mean of the marks of 10 students is 83.8
问题 2. 求下列数据的中位数
2、45、15、18、11、85、19、22、7、5、13
解决方案:
First arrange this data in ascending order
2, 5, 7, 11, 13, 15, 18, 19, 22, 45, 85
Here as we can see that the number of observation is 11 that is odd.
So apply formula of median when the number of observation is odd.
Here n = number of observation that is 11, n = 11
Median = 6th term
That is 15
Therefore,
The median of the data is 15.
问题3.找出学生获得分数的模式是40名学生的50分的班级测试Marks obtained Number of students 10-20 4 20-30 8 30-40 16 40-50 12
解决方案:
To find the mode use the formula of mode for grouped data
Here we have,
f1 = The maximum class frequency = 16
The class interval of f1 = 30-40
l0 = Lower limit of the maximum frequency ( modal class ) = 30
h = Size of the class interval = 10
f0 = Frequency of the preceding class = 8
f2 = Frequency of the succeeding class = 12
Now put all these values in the mode formula for grouped data
= 30+ 6.66
= 36.66
Therefore,
Mode = 36.66
问题 4. 假设一个班有 40 名学生。随机抽取5名学生,测量身高分别为167、162、160、159、169。计算他们身高的标准差?
解决方案:
Here,
N = 5
Mean =
= 163.4
Standard Deviation (S.D) =
Standard Deviation = 4.393
问题 5. 在上面的例子中,找出 5 个选定学生的身高方差?
解决方案:
据我们所知,
方差 = SD 2
标准偏差 = 4.393
方差 = 4.393 2
方差 = 19.298