📜  贝叶斯信仰网络在人工智能中的应用

📅  最后修改于: 2020-09-23 06:42:22             🧑  作者: Mango

人工智能中的贝叶斯信念网络

贝叶斯信念网络是处理概率事件并解决不确定性问题的关键计算机技术。我们可以将贝叶斯网络定义为:

“贝叶斯网络是一种概率图形模型,它使用有向无环图表示一组变量及其条件相关性。”

它也被称为贝叶斯网络,信念网络,决策网络或贝叶斯模型。

贝叶斯网络是概率性的,因为这些网络是根据概率分布构建的,并且还将概率论用于预测和异常检测。

现实世界中的应用程序本质上是概率性的,并且为了表示多个事件之间的关系,我们需要一个贝叶斯网络。它也可以用于各种任务,包括预测,异常检测,诊断,自动洞察,推理,时间序列预测以及不确定情况下的决策。

贝叶斯网络可用于根据数据和专家意见构建模型,它包括两个部分:

  • 有向无环图
  • 条件概率表。

表示和解决不确定知识下的决策问题的贝叶斯网络的广义形式称为影响图。

贝叶斯网络图由节点和弧(有向链接)组成,其中:

  • 每个节点对应于随机变量,并且变量可以是连续离散的
  • 圆弧或有向箭头表示随机变量之间的因果关系或条件概率。这些有向链接或箭头连接图中的一对节点。
    这些链接表示一个节点直接影响另一节点,如果没有定向链接,则意味着节点彼此独立。
    • 在上图中,A,B,C和D是由网络图的节点表示的随机变量。
    • 如果我们正在考虑通过有向箭头将其与节点A连接的节点B,则将节点A称为节点B的父节点。
    • 节点C独立于节点A。

注意:贝叶斯网络图不包含任何循环图。因此,它被称为有向无环图或DAG。

贝叶斯网络主要包括两个部分:

  • 因果成分
  • 实际数字

贝叶斯网络中的每个节点都有条件概率分布P(Xi | Parent(Xi)),它确定了父节点对该节点的影响。

贝叶斯网络基于联合概率分布和条件概率。因此,让我们首先了解联合概率分布:

联合概率分布:

如果我们有变量x1,x2,x3,…..,xn,则x1,x2,x3..xn的不同组合的概率称为联合概率分布。

P [x1,x2,x3,…..,xn],就联合概率分布而言,可以用以下方式表示。

= P [x1 | x2,x3,…..,xn] P [x2,x3,…..,xn]

= P [x1 | x2,x3,…..,xn] P [x2 | x3,….,xn] …. P [xn-1 | xn] P [xn]。

通常,对于每个变量Xi,我们可以将等式写为:

P(Xi|Xi-1,........., X1) = P(Xi |Parents(Xi ))

贝叶斯网络的解释:

让我们通过创建一个有向非循环图来通过一个例子来理解贝叶斯网络:

示例:哈利在家里安装了一个新的防盗警报器以检测盗窃。该报警器在检测到爆窃时可靠地做出响应,但也对轻微地震做出响应。哈利有两个邻居戴维(David)和索菲亚(Sophia),当他们听到警报时,他们有责任在工作中通知哈利。大卫总是在听到警报时给哈利打电话,但有时他对电话铃响感到困惑,并在那个时候打电话。另一方面,索菲亚(Sophia)喜欢听音乐,所以有时她错过了听到警报的声音。在这里,我们要计算盗窃警报的概率。

问题:

计算警报响起的概率,但是既没有发生盗窃,也没有发生地震,David和Sophia都称呼Harry。

解:

  • 下面给出上述问题的贝叶斯网络。网络结构表明,爆窃和地震是警报的父节点,并直接影响警报响起的可能性,但David和Sophia的电话取决于警报的可能性。
  • 网络表明,我们的假设不能直接感知盗窃,也不会注意到小地震,并且在通话前也不会商fer。
  • 每个节点的条件分布以条件概率表或CPT的形式给出。
  • CPT中的每一行必须总和为1,因为表中的所有条目都代表该变量的详尽情况集。
  • 在CPT中,具有k个布尔父级的布尔变量包含2 K个概率。因此,如果有两个父母,那么CPT将包含4个概率值

此网络中发生的所有事件的列表:

  • 盗窃(B)
  • 地震
  • 闹铃(A)
  • 大卫·卡尔斯(D)
  • 索菲亚(S)

我们可以以概率形式写问题陈述的事件:P [D,S,A,B,E],可以使用联合概率分布来重写上述概率陈述:

P [D,S,A,B,E] = P [D | S,A,B,E]。 P [S,A,B,E]

= P [D | S,A,B,E]。 P [S | A,B,E]。 P [A,B,E]

= P [D |一个]。 P [S | A,B,E]。 P [A,B,E]

= P [D |一个]。 P [S |一个]。 P [A | B,E]。 P [B,E]

= P [D |一个 ]。 P [S |一个]。 P [A | B,E]。 P [B | E]。 P [E]

让我们以盗窃和地震分量的观测概率为例:

P(B = True)= 0.002,这是入室盗窃的概率。

P(B = False)= 0.998,这是没有入室盗窃的可能性。

P(E = True)= 0.001,这是发生小地震的概率

P(E = False)= 0.999,这是未发生地震的概率。

我们可以根据下表提供条件概率:

警报A的条件概率表:

警报A的条件概率取决于防盗和地震:

B E P(A= True) P(A= False)
True True 0.94 0.06
True False 0.95 0.04
False True 0.31 0.69
False False 0.001 0.999

David Calls的条件概率表:

David将要呼叫的条件概率取决于警报的概率。

A P(D= True) P(D= False)
True 0.91 0.09
False 0.05 0.95

Sophia电话的条件概率表:

她调用的Sophia的条件概率取决于其父节点“警报”。

A P(S= True) P(S= False)
True 0.75 0.25
False 0.02 0.98

从联合分布的公式中,我们可以以概率分布的形式写问题陈述:

P(S,D,A,¬B,¬E)= P(S | A)* P(D | A)* P(A |¬B^¬E)* P(¬B)* P(¬E )。

= 0.75 * 0.91 * 0.001 * 0.998 * 0.999

= 0.00068045。

因此,贝叶斯网络可以通过使用联合分布来回答有关该域的任何查询。

贝叶斯网络的语义:

有两种方法可以理解贝叶斯网络的语义,如下所示:

1.理解网络作为联合概率分布的表示。

了解如何构建网络将很有帮助。

2.将网络理解为条件独立性声明集合的编码。

这对设计推理程序很有帮助。