📅  最后修改于: 2020-09-23 08:36:41             🧑  作者: Mango
人工智能中的代理环境
环境是围绕代理的世界上的所有事物,但它不是代理本身的一部分。可以将环境描述为存在代理的情况。
代理人生活,操作并为代理人提供感知和采取行动的环境。人们通常认为环境是非女性主义的。
环境特征
根据Russell和Norvig,从代理的角度来看,环境可以具有各种功能:
- 完全可观察与部分可观察
- 静态与动态
- 离散与连续
- 确定性与随机性
- 单代理与多代理
- 情节与顺序
- 已知与未知
- 无障碍与无障碍
1.完全可观察与部分可观察:
- 如果代理传感器可以在每个时间点感知或访问环境的完整状态,则它是完全可观察的环境,否则它是部分可观察的 。
- 完全可观察的环境很容易,因为无需维护内部状态即可跟踪世界历史。
- 在所有环境中都没有传感器的代理,那么这种环境被称为不可观察的 。
2.确定性与随机性:
- 如果代理程序的当前状态和选定的动作可以完全确定环境的下一个状态,则该环境称为确定性环境。
- 随机环境本质上是随机的,不能完全由代理确定。
- 在确定的,完全可观察的环境中,代理无需担心不确定性。
3.情节与顺序:
- 在情景环境中,有一系列的一次性操作,并且仅需要当前感知即可。
- 但是,在顺序环境中,代理需要记忆过去的操作以确定下一个最佳操作。
4.单代理与多代理
- 如果环境中仅涉及一个代理程序,并由其自身进行操作,则该环境称为单代理程序环境。
- 但是,如果多个代理程序在一个环境中运行,那么这种环境称为多代理程序环境。
- 多代理环境中的代理设计问题不同于单代理环境。
5.静态与动态:
- 如果在代理程序进行讨论时环境可以改变自身,则该环境称为动态环境,否则称为静态环境。
- 静态环境易于处理,因为代理在决定采取行动时无需继续观察世界。
- 但是对于动态环境,座席需要始终关注每个动作。
- 出租车驾驶是动态环境的一个示例,而填字游戏则是静态环境的一个示例。
6.离散与连续:
- 如果在一个环境中可以在其中执行有限数量的感知和动作,则该环境称为离散环境,否则称为连续环境。
- 象棋游戏是在离散环境下进行的,因为可以执行的动作数量有限。
- 无人驾驶汽车是连续环境的一个例子。
7.已知与未知
- 已知和未知实际上不是环境的特征,而是执行操作的主体的知识状态。
- 在已知的环境中,代理会知道所有操作的结果。在未知环境中,座席需要学习其工作方式才能执行操作。
- 已知环境很有可能是部分可观察的,而未知环境是完全可观察的。
8.可访问与不可访问
- 如果代理可以获取有关该州环境的完整而准确的信息,则该环境称为可访问环境,否则称为不可访问环境。
- 一个空房间,其状态可以通过其温度来定义,这是可访问环境的一个示例。
- 有关地球上事件的信息是不可访问环境的一个示例。