人工智能被定义为对理性主体的研究。理性主体可以是任何人,公司,机器或软件来做出决策的事物。在考虑过去和当前的感知(给定实例中代理的感知输入)后,它会以最佳结果执行操作。
一个AI系统由一个代理及其环境组成。代理人在其环境中行动。该环境可能包含其他代理。代理可以看作是任何东西:
- 通过传感器感知环境
- 通过执行器作用于该环境
注意:每个代理都可以感知自己的动作(但并不总是效果)
要了解智能代理的结构,我们应该熟悉体系结构和代理程序。体系结构是代理执行的机制。它是带有传感器和执行器的设备,例如:自动驾驶汽车,照相机,PC。代理程序是代理函数的实现。代理函数是指从感知序列(代理迄今为止所知的所有历史)到一个动作的映射。
Agent = Architecture + Agent Program
代理示例:-
一个软件代理具有击键,文件内容,已接收的充当传感器并在屏幕上显示的网络软件包,文件,已发送的网络数据包(用作执行器)。
人类代理的眼睛,耳朵和其他器官充当传感器,而手,腿,嘴和其他身体部位充当促动器。
机器人代理具有充当传感器的照相机和红外测距仪,以及充当致动器的各种电机。
代理商类型
根据代理人感知的智力和能力的程度,他们可以分为四类:
- 简单的反射剂
- 基于模型的反射代理
- 基于目标的代理
- 基于实用程序的代理
- 学习代理
简单的反射剂
简单的反射代理会忽略其余的感知历史,仅在当前感知的基础上起作用。感知历史是代理迄今为止所感知的所有历史。代理函数基于条件操作规则。条件动作规则是将状态即条件映射到动作的规则。如果条件为真,则采取措施,否则采取行动。仅在完全可观察到环境时,此代理函数才会成功。对于在部分可观察的环境中运行的简单反射代理程序来说,无限循环通常是不可避免的。如果代理可以随机化其动作,则有可能摆脱无限循环。简单反射剂的问题是:
- 智力非常有限。
- 不了解状态的非感知部分。
- 通常太大而无法生成和存储。
- 如果环境发生任何变化,则需要更新规则集合。
基于模型的反射剂
它通过查找条件与当前情况匹配的规则来工作。基于模型的代理可以通过使用关于世界的模型来处理部分可观察的环境。代理必须跟踪内部状态,该状态由每个感知调整,并且取决于感知历史。当前状态存储在代理内部,该代理保持某种描述世界看不见的部分的结构。更新状态需要有关以下信息:
- 世界如何从主体独立地发展,以及
- 代理人的行为如何影响世界。
目标代理
这类代理根据他们当前距离目标有多远(理想情况的描述)来做出决定。他们的每一个动作都是为了减少与目标的距离。这使代理可以在多种可能性中进行选择,从而选择达到目标状态的一种可能性。支持其决策的知识可以明确表示,并且可以修改,这使这些代理更加灵活。他们通常需要搜索和计划。基于目标的业务代表的行为可以轻松更改。
基于实用程序的代理
以最终用途为基础而开发的代理称为基于实用程序的代理。如果有多种可能的选择,则使用基于实用程序的代理程序来决定哪个是最佳选择,它们基于每种状态的偏好(实用程序)来选择操作。有时,实现预期目标还不够。我们可能会寻求更快,更安全,更便宜的到达目的地的旅程。应该考虑代理人的幸福。实用程序描述了代理人有多“高兴” 。由于世界上的不确定性,公用事业代理人选择了使期望的公用事业最大化的行动。效用函数将状态映射到描述相关联的幸福程度的实数上。
学习代理
AI中的学习代理是可以从其过去的经验中学习或具有学习能力的代理的类型。
它从基本知识开始行动,然后能够通过学习自动行动和适应。
学习代理主要具有四个概念性组成部分,分别是:
- 学习要素:负责通过从环境中学习来进行改进
- 批评者:学习元素从批评者那里获得反馈,该反馈描述了座席在固定绩效标准方面的表现。
- 绩效要素:负责选择外部行动
- 问题发生器:此组件负责建议可带来新的和有益的经验的操作。