📜  受限玻尔兹曼机

📅  最后修改于: 2022-05-13 01:58:08.043000             🧑  作者: Mango

受限玻尔兹曼机

什么是玻尔兹曼机?

它是一个神经元网络,其中所有的神经元都相互连接。在这台机器中,有两个层分别命名为可见层或输入层和隐藏层。可见层表示为v ,隐藏层表示为h。在玻尔兹曼机中,没有输出层。玻尔兹曼机是随机生成的神经网络,能够学习内部表示,并且能够表示和(如果有足够的时间)解决棘手的组合问题。

玻尔兹曼分布(也称为吉布斯分布)是统计力学的一个组成部分,也解释了熵和温度等参数对热力学中量子态的影响。因此,它也被称为基于能量的模型 (EBM) 。它由时任卡内基梅隆大学教授的 Geoffrey Hinton 和时任约翰霍普金斯大学教授的 Terry Sejnowski 于 1985 年发明

什么是受限玻尔兹曼机 (RBM)?



限制性术语是指不允许将相同类型的层相互连接。换句话说,输入层或隐藏层的两个神经元不能相互连接。虽然隐藏层和可见层可以相互连接。

就像在这台机器中一样,没有输出层,所以问题是我们将如何识别、调整权重以及如何衡量我们的预测是否准确。所有问题都有 1 个答案是受限玻尔兹曼机。

RBM 算法是由 Geoffrey Hinton (2007) 提出的,它在其样本训练数据输入上学习概率分布。它在有监督/无监督机器学习的不同领域得到了广泛的应用,例如特征学习、降维、分类、协同过滤和主题建模。

考虑推荐系统部分中讨论的示例电影评级。

《复仇者联盟》、《阿凡达》和《星际穿越》等电影与最新的奇幻和科幻元素有着密切的联系。基于用户评级,RBM 将发现可以解释电影选择激活的潜在因素。简而言之,RBM 描述了输入数据集相关变量之间的可变性,即潜在的未观察变量数量较少。

能量函数由下式给出


\mathrm{E}(\mathrm{v}, \mathrm{h})=-\mathrm{a}^{\mathrm{T}} \mathrm{v}-\mathrm{b}^{\mathrm{T}} \mathrm{h}-\mathrm{v}^{\mathrm{T}} \mathrm{Wh}

受限玻尔兹曼机是如何工作的?



在 RBM 中,整个 RBM 的工作分为两个阶段:

第一阶段:在这个阶段,我们采用输入层并使用权重和偏置的概念来激活隐藏层。这个过程被称为前馈传递。在前馈传递中,我们正在识别正关联和负关联。

前馈方程:

  • 正关联——当可见单元和隐藏单元之间的关联是正关联时。
  • 负关联——当可见单元和隐藏单元之间的关联为负时。

第二阶段:因为我们没有任何输出层。我们不是计算输出层,而是通过激活的隐藏状态重建输入层。这个过程被称为 Feed Backward Pass。我们只是通过激活的隐藏神经元回溯输入层。执行此操作后,我们通过激活的隐藏状态重建了 Input。所以,我们可以这样计算误差和调整权重:

反馈方程:

  • 错误 =重构输入层-实际输入层
  • 调整权重 =输入*错误*学习率 (0.1)

完成所有步骤后,我们得到了负责激活隐藏神经元的模式。了解它是如何工作的。

让我们考虑一个例子,其中我们假设 V1 可见单元激活 h1 和 h2 隐藏单元,V2 可见单元激活 h2 和 h3 隐藏单元。现在,当任何新的可见单元让 V5 进入机器时,它也会激活 h1 和 h2 单元。因此,我们可以轻松回溯隐藏单元,并确定新 V5 神经元的特征与 V1 匹配。这是因为 V1 也更早地激活了相同的隐藏单元。

受限玻尔兹曼机