📜  数据挖掘-贝叶斯分类

📅  最后修改于: 2021-01-11 06:30:30             🧑  作者: Mango


贝叶斯分类基于贝叶斯定理。贝叶斯分类器是统计分类器。贝叶斯分类器可以预测类成员的概率,例如给定元组属于特定类的概率。

贝叶定理

贝叶斯定理以托马斯·贝叶斯命名。有两种类型的概率-

  • 后验概率[P(H / X)]
  • 先验概率[P(H)]

其中X是数据元组,H是一些假设。

根据贝叶斯定理,

P(H / X)= P(X / H)P(H)/ P(X)

贝叶斯信念网络

贝叶斯信念网络指定联合条件概率分布。它们也被称为信仰网络,贝叶斯网络或概率网络。

  • 信任网络允许在变量子集之间定义类条件独立性。

  • 它提供了因果关系的图形模型,可以在该模型上进行学习。

  • 我们可以使用训练有素的贝叶斯网络进行分类。

定义贝叶斯信任网络的组件有两个-

  • 有向无环图
  • 一组条件概率表

有向无环图

  • 有向无环图中的每个节点代表一个随机变量。
  • 这些变量可以是离散值或连续值。
  • 这些变量可能对应于数据中给出的实际属性。

有向无环图表示

下图显示了六个布尔变量的有向无环图。

非循环图

图中的弧形表示因果知识。例如,肺癌受一个人的肺癌家族病史以及该人是否吸烟的影响。值得注意的是,鉴于我们知道患者患有肺癌,因此变量PositiveXray与患者是否患有肺癌家族史或吸烟者无关。

条件概率表

变量LungCancer(LC)的值的条件概率表显示其父节点,FamilyHistory(FH)和Smoker(S)的值的每种可能组合,如下所示-

概率表