📜  数学 |概率分布集 2(指数分布)

📅  最后修改于: 2021-09-23 04:50:23             🧑  作者: Mango

上一篇文章介绍了概率分布的基础知识,并讨论了均匀概率分布。本文介绍了指数概率分布,它与均匀分布一样也是连续分布。

介绍 –

假设我们面临这样一个问题——在给定事件发生之前,我们需要等待多长时间?
如果我们使用指数分布对给定问题进行建模,则可以用概率术语给出这个问题的答案。
由于我们需要等待的时间是未知的,我们可以将其视为一个随机变量。如果事件在给定区间内发生的概率与区间的长度成正比,则随机变量具有指数分布。
指数随机变量的支持(随机变量可以采用的值集)是所有正实数的集合。
 R_X = [0, \infty)

概率密度函数-

对于正实数\lambda指数分布随机变量的概率密度函数由下式给出-

     f_X(x) =  \[  \begin{cases}      \lambda e^{-\lambda x} & if x\in R_X 0 \\     0 & if x \notin R_X  \end{cases} \]

这里\lambda是速率参数及其对密度函数的影响如下图所示 –

22

要检查上述函数是否是合法的概率密度函数,我们需要检查它的支持度是否为 1 的积分。

     \begin{equation*} \begin{split} & = \int\limits_{-\infty}^{\infty} f_X(x) dx \\ & = \int\limits_{0}^{\infty} \lambda e^{-\lambda x} dx \\ & = \frac{\lambda}{-\lambda} \big[ e^{-\lambda x} \big] \limits_{0}^{\infty}  \\ & =  - \big[ 0 - 1 \big]  \\ & = 1 \end{split} \end{equation*}

累积密度函数-

众所周知,累积密度函数只不过是达到某个值的所有事件的概率之和x = t .
在指数分布中,累积密度函数F(X)是(谁)给的-

     \begin{equation*} \begin{split} F(X) &= \int\limits_{0}^{t} \lambda e^{-\lambda x} dx \\ &= \big[ \frac{\lambda e^{-\lambda x}}{-\lambda} \big]\limits_{0}^{t} \\ &= \big[ -e^{-\lambda t} + 1 \big]\\ &= 1 -e^{-\lambda t}  \end{split} \end{equation*}

期望值 –

为了找出期望值,我们简单地将概率分布函数与 x 相乘并对所有可能的值(支持)进行积分。

     \begin{equation*} \begin{split} E[X] & = \int\limits_{-\infty}^{\infty} xf_X(x) dx \\ & = \lambda \int\limits_{0}^{\infty} xe^{-\lambda x} dx \\ & = \lambda \Big\{ \big[ x\int e^{-\lambda x} dx\big]\limits_{0}^{\infty} - \big[ \int \frac{d}{dx} x \big(\int e^{-\lambda x} dx\big)dx \big]\limits_{0}^{\infty} \Big\} \\ & = \lambda \Big\{ \big[ x \frac{e^{-\lambda x}}{-\lambda} \big]\limits_{0}^{\infty} - \big[ \int \frac{e^{-\lambda x}}{-\lambda} dx \big]\limits_{0}^{\infty} \Big\} \\ & = \big[ \frac{-x}{e^{\lambda x}} \big]\limits_{0}^{\infty} + \big[ \int e^{-\lambda x} dx \big]\limits_{0}^{\infty} \\ & = \big[ \frac{-x}{e^{\lambda x}} \big]\limits_{0}^{\infty} + \big[ \frac{e^{-\lambda x}}{-\lambda} \big]\limits_{0}^{\infty} \\ & = \big[ 0-0 \big] - \frac{1}{\lambda} \big[ 0-1 \big] \\ & = \frac{1}{\lambda} \end{split} \end{equation*}

方差和标准差 –

指数分布的方差由下式给出 –

     \begin{equation*} \begin{split} Var[X] &= E[X^2] - E[X]^2\\ & = \int\limits_{-\infty}^{\infty} x^2f_X(x) dx - \frac{1}{\lambda ^2}\\ & = \lambda \int\limits_{0}^{\infty} x^2 e^{-\lambda x} dx - \frac{1}{\lambda ^2}\\ & = \lambda \Big\{ \big[ x^2\int e^{-\lambda x} dx\big]\limits_{0}^{\infty} - \big[ \int \frac{d}{dx} x^2 \big(\int e^{-\lambda x} dx\big)dx \big]\limits_{0}^{\infty} \Big\} - \frac{1}{\lambda ^2}\\ & = \lambda \Big\{ \big[ x^2 \frac{e^{-\lambda x}}{-\lambda} \big]\limits_{0}^{\infty} - \big[ \int 2x\frac{e^{-\lambda x}}{-\lambda} dx \big]\limits_{0}^{\infty} \Big\} - \frac{1}{\lambda ^2}\\ & = \big[ \frac{-x^2}{e^{\lambda x}} \big]\limits_{0}^{\infty} + \frac{2}{\lambda}\big[ \int xe^{-\lambda x} dx \big]\limits_{0}^{\infty} - \frac{1}{\lambda ^2}\\ & = [0-0] + \frac{2}{\lambda} * \frac{1}{\lambda} - \frac{1}{\lambda ^2} \\  & = \frac{2}{\lambda ^2} - \frac{1}{\lambda ^2}\\ & = \frac{1}{\lambda ^2} \end{split} \end{equation*}

分布的标准偏差 –

     \begin{equation*} \begin{split} \sigma &= \sqrt{Var[X]}\\ &= \sqrt{\frac{1}{\lambda ^2}}\\ &= \frac{1}{\lambda} \end{split} \end{equation*}

  • 示例 –让 X 表示使用盖革计数器检测到粒子之间的时间,并假设 X 具有 E(X) = 1.4 分钟的指数分布。我们在启动计数器后 30 秒内检测到粒子的概率是多少?
  • 解决方案 –由于表示连续检测粒子之间的时间的随机变量 (X) 呈指数分布,因此期望值由- E[X] = \frac{1}{\lambda}
    \frac{1}{\lambda} = 1.4\\ \lambda = \frac{1}{1.4}
    为了求出实验开始后 30 秒内检测到粒子的概率,我们需要使用上面讨论的累积密度函数。我们将给定的 30 秒转换为分钟,因为我们有以分钟为单位的速率参数。
     F(0.5) = 1 - e^{\frac{-0.5}{1.4}} \\ F(0.5) = 0.30

缺乏记忆特性 –

现在考虑在上面的示例中,在 30 秒标记处检测到粒子后,三分钟后没有检测到粒子。
因为我们一直在等待在过去3分钟,我们认为,检测是由于即检测的粒子的在接下来的30秒内的概率应高于0.3。然而。这不适用于指数分布。我们可以通过找到上述场景的概率来证明这一点,它可以表示为条件概率——
 P(X < 3.5 | X \geq 3) = \frac{P((X < 3.5) \cap (X \geq 3))}{P(X \geq 3)} = \frac{P(3 < X < 3.5)}{P(X \geq 3)}\\\\ P(3 < X < 3.5) = F(3.5) - F(3) = (1 - e^{\frac{-3.5}{1.4}}) - (1 - e^{\frac{-3}{1.4}}) = 0.035 \\\\ P(X \geq 3) = 1 - F(3) = e^{\frac{-3}{1.4}} = 0.117\\\\ P(X < 3.5 | X \geq 3) = \frac{0.035}{0.117} = 0.3
我们在没有检测到的情况下等待了 3 分钟这一事实不会改变在接下来的 30 秒内检测到的概率。因此,概率仅取决于所考虑的区间的长度。

参考 –

指数分布
Statlect.com