在概率上,随机变量是一个变量,其值是随机实验的结果。随机变量分为离散和连续随机变量。顾名思义,离散随机变量采用离散值或换句话说,离散随机变量采用的值数量是可数的,而连续随机变量则采用特定间隔中存在的所有值,因此它是不可数。
离散随机变量的示例
在谈论离散随机变量时想到的一个非常基本的基础示例是无偏标准模具的滚动。无偏标准骰子是具有六个面且任何面出现在顶部的机会均等的骰子。考虑到我们执行了该实验,很明显,我们的实验只有六个结果。因此,我们的随机变量可以采用1到6之间的以下任意离散值。在数学上,随机变量采用的值的集合表示为一个集合。在这种情况下,让随机变量为X。
因此,X = {1,2,3,4,5,6}
离散随机变量的另一个流行示例是抛硬币。在这种情况下,随机变量X只能采用Heads或Tails两种选择中的一种。
因此,X = {H,T}
连续随机变量的示例
考虑一个广义的实验,而不是进行一些特定的实验。假设在您的实验中,该实验的结果可以采用某个时间间隔(a,b)中的值。这意味着在进行实验时,间隔中的每个点都可以作为结果值。因此,在这组可能的值中没有离散值,而是有一个间隔
因此,X = {x:x属于(a,b)}
为离散随机变量构造概率分布
概率分布是一种分布随机变量可以采用的所有可能值的概率的方法。在为随机变量构造任何概率分布表之前,在构造任何分布表时,以下条件应同时保持有效
- 与随机变量的每个可能值相关的所有概率应为正且在0到1之间
- 与每个随机变量相关的所有概率之和应总计为1
例子:
考虑以下问题,其中一个标准模具正在滚动,并且假定存在任何可能性
face与在其面上获得的数字的平方成正比。获取概率分布表
与此实验有关
解决方案:
Since P(x) ∝ x => P(x) = kx2 where k is the proportionality constant and x are the numbers from 1 to 6
Also from the two conditions listed above we know that the sum of all probabilities is 1
Thus ∑ kx2 = 1 when summation is varied over x
=> k + 4k + 9k + 16k + 25k + 36k = 1
=> 91k =1
=> k = 1/91
因此,将k的值代入每个概率,我们可以获得每个随机变量的概率,然后形成一个表,我们得到
x | 1 | 2 | 3 | 4 | 5 | 6 |
P(x) | 1/91 | 4/91 | 9/91 | 16/91 | 25/91 | 36/91 |
检查概率分布的有效性
任何有效的概率分布表都应满足上述两个条件,即
- 与随机变量的每个可能值相关的所有概率应为正且在0到1之间
- 与每个随机变量相关的所有概率之和应加起来为1
例子:
检查以下概率分布表是否有效
一种)
x | 1 | 2 | 5 | 7 |
P(x) | 0.2 | 0.1 | 0.1 | 0.6 |
这是有效的分配表,因为
- 所有单个概率都在0到1之间
- 所有单个概率的总和为1
b)
x | 0 | 1 | 2 | 3 | 4 | 5 |
P(x) | 0.32 | 0.28 | 0.1 | -0.4 | 0.2 | 0.1 |
这不是有效的分发表,因为
- 有一种情况是负数的可能性
C)
x | 1 | 2 | 3 | 4 |
P(x) | 0.4 | 0.2 | 0.25 | 0.1 |
这不是有效的分发表,因为
- 所有单个概率的总和虽然为正且在0到1之间,但总和不等于1。对于要成为有效分布表的表,两个条件应同时满足
概率模型示例:冷冻酸奶模型
冷冻酸奶模型基本上是这样的情况,即人们在商店外面排队等候购买冷冻酸奶。该人员每天在特定时间去商店,并记下排队等候的人数。现在,假设店主是一个非常有效率的人,并且迅速地处理订单,因此队列中等待订单的人数不能超过2。
假设您到商店购物50天后记下以下观察结果
Number of people in queue | Frequency |
0 | 14 |
1 | 25 |
2 | 11 |
现在假设该人在第51天去商店。他多大可能会发现
a)队列中有0人
b)1人在排队
c)2人在排队
解决方案:
首先,我们需要构建概率分布表,该表将给出队列长度为0或1或2个人的概率。
使用基本的概率公式
P(x)=有利结果/总结果
将其应用于每一行,我们得出概率表为
x | P(x) |
0 | 14/50 = 0.28 |
1 | 25/50 = 0.5 |
2 | 11/50 = 0.22 |
现在,该人在第51天购买冷冻酸奶时,会发现
a)队列中0人的概率为0.28
b)队列中1个人的概率为0.5
c)队列中2个人的概率为0.22
Note: During any practical experiment like the frozen yoghurt model, the probabilities get more and more accurate when your number of sample observations increase.
随机变量的期望值或期望值
随机变量的“期望”或“期望值”是您期望某些实验的结果平均的值。
期望用E(X)表示
可以根据您拥有的随机变量的类型来计算对随机变量的期望。
For a Discrete Random Variable, E(X) = ∑x * P(X = x)
For a Continuous Random Variable, E(X) = ∫x * f(x)
where,
The limits of integration are -∞ to + ∞ and
f(x) is the probability density function
离散随机变量的期望
对于离散随机变量,如上所述,期望为E(X)= ∑ x * P(X = x)。以下示例将更清楚地说明期望的定义和计算
示例:滚动标准无偏模具时的期望是什么?
解决方案:
Rolling a fair die has 6 possible outcomes : 1, 2, 3, 4, 5, 6 each with an equal probability of 1/6
Let X indicate the outcome of the experiment
Thus P(X=1) = 1/6
P(X=2) = 1/6
P(X=3) = 1/6
P(X=4) = 1/6
P(X=5) = 1/6
P(X=6) = 1/6
Thus, E(X) = ∑ x * P(X=x)
E(X) = 1*(1/6) + 2*(1/6) + 3*(1/6) + 4*(1/6) + 5*(1/6) + 6*(1/6)
E(X) = 7/2 = 3.5
This expected value kind of intuitively makes sense as well because 3.5 is in halfway in between the possible values the die can
take and thus this is the value that you could expect.
期望的性质
- 通常,对于任何函数f(x),期望为E [f(x)] = ∑ f(x)* P(X = x)
- 如果k为常数,则E(k)= k
- 如果k是一个常数并且f(x)是x的函数,则E [kf(x)] = k E [f(x)]
- 令c 1和c 2为常数,而u 1和u 2为x的函数,则E = c 1 E [u 1 (x)] + c 2 E [u 2 (x)]
示例:给定E(X)= 4且E(X 2 )= 6找出E(3X 2 – 4X + 2)的值
解决方案:
Using the various properties of expectation listed above , we get
E(3X2 – 4X + 2) = 3 * E(X2) – 4 * E(X) + E(2)
= 3 * 6 – 4 * 4 + 2
= 4
Thus, E(3X2 – 4X + 2) = 4
离散随机变量的方差和标准差
方差和标准差是随机变量散布的最主要和最常用的度量。简而言之,术语“价差”表示变量值距参考点有多远或多近。
X的方差用Var(X)表示,标准偏差基本上只是方差的平方根。
数学上,对于离散随机变量X, Var(X)= E(X 2 )– [E(X)] 2
方差的性质
- 当k为常数时Var(k)= 0
- Var [aX + b] = a 2 Var(X)
示例1:滚动平模时找到方差和标准偏差
解决方案:
From one of the examples mentioned earlier , we figured out that the when a fair die is rolled, E(X) = 3.5
Also, to find out Variance, we would need to find E(X2)
Using properties of Expectation, E(X2) = ∑ x2 * P(X=x)
Thus, E(X2) = 1*(1/6) + 4*(1/6) + 9*(1/6) + 16*(1/6) + 25*(1/6) + 36*(1/6)
= 91/6 = 15.16
And Thus Var(X) = 15.16 – (3.5)2
= 2.916 = 35/12
Standard deviation is the square root of Variance
Thus, Standard deviation = 1.7076
示例2:找到以下概率分布表的方差和标准差
X | 0 | 1 | 2 | 3 |
P(X) | 0.1 | 0.2 | 0.4 | 0.3 |
解决方案:
First off, we need to check if this distribution table is valid or not.
We see that both the conditions that are necessary for a distribution table being valid are satisfied simultaneously here. Thus, this is a valid distribution table.
Now to find variance, we need E(X) and E(X2)
E(X) = 0 * 0.1 + 1 * 0.2 + 2 * 0.4 + 3 * 0.3
Thus, E(X) = 1.9
E(X2) = 0 * 0.1 + 1 * 0.2 + 4 * 0.4 + 9 * 0.3
Thus, E(X2) = 4.5
Thus Var(X) = 4.5 – (1.9)2
= 0.89
Standard deviation = (0.89)0.5 = 0.9433