📜  人工智能-神经网络

📅  最后修改于: 2021-01-23 05:46:13             🧑  作者: Mango


人工智能的另一个研究领域是神经网络,它受到人类神经系统的自然神经网络的启发。

什么是人工神经网络(ANN)?

第一台神经计算机的发明者Robert Hecht-Nielsen博士将神经网络定义为-

“……一个由许多简单的,高度互连的处理元件组成的计算系统,它们通过对外部输入的动态状态响应来处理信息。”

人工神经网络的基本结构

人工神经网络的思想是基于这样的信念,即可以通过使用硅和金属丝作为活的神经元树突来模仿人脑通过建立正确的连接来工作。

人脑由860亿个称为神经元的神经细胞组成它们通过轴突连接到其他数千个单元格树突接受外部环境的刺激或感觉器官的输入。这些输入会产生电脉冲,然后迅速通过神经网络传播。然后,神经元可以将消息发送给其他神经元以处理问题,也可以不将其转发。

神经元的结构

人工神经网络由多个节点组成,这些节点模仿人脑的生物神经元。神经元通过链接连接,并且彼此交互。节点可以获取输入数据并对该数据执行简单的操作。这些操作的结果将传递给其他神经元。每个节点的输出称为其激活节点值。

每个链接都与权重相关联人工神经网络具有学习能力,可以通过更改权重值进行学习。下图显示了一个简单的ANN-

典型的人工神经网络

人工神经网络的类型

有两种人工神经网络拓扑结构-前反馈。

前馈神经网络

在该人工神经网络中,信息流是单向的。一个单元将信息发送到其他未接收到任何信息的单元。没有反馈回路。它们用于模式生成/识别/分类。它们具有固定的输入和输出。

前馈神经网络

反馈神经网络

在此,允许反馈循环。它们用于内容可寻址存储器。

反馈神经网络

人工神经网络的工作

在所示的拓扑图中,每个箭头表示两个神经元之间的连接,并指示信息流的路径。每个连接都有权重,该权重是控制两个神经元之间信号的整数。

如果网络生成“良好或期望”的输出,则无需调整权重。但是,如果网络生成“不良或不希望的”输出或错误,则系统会更改权重以改善后续结果。

人工神经网络中的机器学习

人工神经网络具有学习能力,需要接受培训。有几种学习策略-

  • 有监督的学习-它涉及的老师比ANN本身更学者。例如,教师提供了一些示例数据,教师已经知道了这些示例数据。

    例如,模式识别。人工神经网络在识别时提出猜测。然后,老师向ANN提供答案。然后网络将其猜测与教师的“正确”答案进行比较,并根据错误进行调整。

  • 无监督学习-如果没有答案已知的示例数据集,则是必需的。例如,搜索隐藏的图案。在这种情况下,基于存在的现有数据集执行聚类,即根据一些未知模式将一组元素划分为多个组。

  • 强化学习-此策略建立在观察的基础上。人工神经网络通过观察其环境来做出决定。如果观察结果是否定的,则网络会调整其权重,以便下次可以做出其他所需的决定。

反向传播算法

它是训练或学习算法。它通过示例学习。如果将算法的示例提交给算法,则它将更改网络的权重,以便在完成训练后可以为特定输入生成所需的输出。

反向传播网络非常适合简单的模式识别和映射任务。

贝叶斯网络(BN)

这些是用于表示一组随机变量之间的概率关系的图形结构。贝叶斯网络也称为Belief网络贝叶斯网络。 BN关于不确定域的原因。

在这些网络中,每个节点代表具有特定命题的随机变量。例如,在医学诊断领域中,节点癌症代表患者患有癌症的主张。

连接节点的边表示这些随机变量之间的概率相关性。如果在两个节点中,一个正在影响另一个,则必须按照效果方向将它们直接连接。变量之间关系的强度通过与每个节点关联的概率来量化。

BN中的弧只有一个约束,即您不能仅通过遵循有向弧来返回节点。因此,BN称为有向无环图(DAG)。

BN能够同时处理多值变量。 BN变量由两个维度组成-

  • 介词范围
  • 分配给每个介词的概率。

考虑离散随机变量的有限集X = {X 1 ,X 2 ,…,X n },其中每个变量X i可以取自有限集的值,用Val(X i )表示。如果存在从变量X i到变量X j的定向链接则变量X i将是变量X j的父级,从而显示变量之间的直接依赖关系。

BN的结构是结合先验知识和观察数据的理想选择。即使在缺少数据的情况下,BN也可用于了解因果关系并了解各种问题领域并预测未来事件。

建立贝叶斯网络

知识工程师可以构建贝叶斯网络。知识工程师在构建它时需要采取许多步骤。

示例问题肺癌。病人一直呼吸困难。他去看医生,怀疑自己患有肺癌。医生知道,除非患有肺癌,否则患者可能患有多种其他疾病,例如肺结核和支气管炎。

收集问题的相关信息

  • 病人是吸烟者吗?如果是,那么癌症和支气管炎的可能性很高。
  • 患者是否受到空气污染?如果是,那是什么空气污染?
  • 进行X射线检查阳性X射线将表明结核病或肺癌。

确定有趣的变量

知识工程师试图回答问题-

  • 代表哪些节点?
  • 他们可以采取什么价值观?它们可以处于哪种状态?

现在,让我们考虑只有离散值的节点。变量一次必须恰好采用这些值之一。

离散节点的常见类型是

  • 布尔节点-它们表示命题,采用二进制值TRUE(T)和FALSE(F)。

  • 有序值-节点“污染”可能代表{低,中,高}并从中获取描述患者暴露于污染程度的值。

  • 整数值-称为“年龄”的节点可能代表患者的年龄,可能的值介于1到120之间。即使在此早期阶段,仍在进行建模选择。

肺癌示例的可能节点和值-

Node Name Type Value Nodes Creation
Polution Binary {LOW, HIGH, MEDIUM} BNN Node Creation
Smoker Boolean {TRUE, FASLE}
Lung-Cancer Boolean {TRUE, FASLE}
X-Ray Binary {Positive, Negative}

在节点之间创建弧

网络拓扑应捕获变量之间的定性关系。

例如,是什么导致患者患上肺癌? -污染和吸烟。然后从节点污染和节点吸烟者向节点肺癌添加弧

同样,如果患者患有肺癌,则X射线检查结果将为阳性。然后从节点Lung-Cancer向节点X-Ray添加弧

BNN弧创建

指定拓扑

通常,BN的布局使弧从顶部指向底部。节点X的父节点集由Parents(X)给出。

Lung-Cancer节点有两个父级(原因或原因): PollutionSmoker ,而Smoker是Node X-Ray祖先。同样, X射线是结节肺癌的子代(后果或影响),是结节吸烟者污染的继任者

条件概率

现在,量化连接的节点之间的关系:这是通过为每个节点指定条件概率分布来完成的。由于此处仅考虑离散变量,因此采取条件概率表(CPT)的形式。

首先,对于每个节点,我们需要查看那些父节点的所有可能值组合。每个这样的组合称为父集的实例化。对于父节点值的每个不同的实例,我们需要指定子级将采用的概率。

例如,“肺癌”节点的父级是“污染”和“吸烟”。它们取可能的值= {(H,T),(H,F),(L,T),(L,F)}。 CPT将这两种情况下的癌症概率分别指定为<0.05、0.02、0.03、0.001>。

每个节点的条件概率如下:

机率

神经网络的应用

他们可以执行对人类来说很容易但是对机器来说很困难的任务-

  • 航空航天-自动驾驶飞机,飞机故障检测。

  • 汽车-汽车制导系统。

  • 军事-武器方向和操纵,目标跟踪,物体识别,面部识别,信号/图像识别。

  • 电子产品-代码序列预测,IC芯片布局,芯片故障分析,机器视觉,语音合成。

  • 财务-房地产评估,贷款顾问,抵押筛选,公司债券评级,证券交易程序,公司财务分析,货币价值预测,文档阅读器,信贷申请评估者。

  • 工业-制造过程控制,产品设计和分析,质量检查系统,焊接质量分析,纸张质量预测,化学产品设计分析,化学过程系统动态建模,机器维护分析,项目招标,计划和管理。

  • 医疗-癌细胞分析,脑电图和心电图分析,修复设计,移植时间优化器。

  • 语音-语音识别,语音分类,文本到语音的转换。

  • 电信-图像和数据压缩,自动化信息服务,实时口语翻译。

  • 运输-卡车制动系统诊断,车辆调度,路线选择系统。

  • 软件-面部识别,光学字符识别等中的模式识别

  • 时间序列预测-人工神经网络用于预测种群和自然灾害。

  • 信号处理-可以训练神经网络处理音频信号,并在助听器中对其进行适当的滤波。

  • 控制-人工神经网络通常用于做出物理车辆的转向决策。

  • 异常检测-由于ANN擅长识别模式,因此也可以训练它们,以在异常情况发生时产生不适合模式的输出。