人工智能中的环境类型
人工智能中的环境是代理的周围。代理通过传感器从环境中获取输入,并通过执行器将输出传递给环境。有几种类型的环境:
- 完全可观察 vs 部分可观察
- 确定性与随机性
- 竞争与合作
- 单代理 vs 多代理
- 静态与动态
- 离散 vs 连续
1. 完全可观察与部分可观察
- 当代理传感器能够在每个时间点感知或访问代理的完整状态时,它被称为完全可观察的环境,否则它是部分可观察的。
- 维护一个完全可观察的环境很容易,因为不需要跟踪周围的历史。
- 当代理在所有环境中都没有传感器时,该环境被称为不可观察的。
- 例子:
- 国际象棋 -棋盘是完全可观察的,对手的动作也是如此
- 驾驶 -环境是部分可观察的,因为即将发生的事情是未知的。
2. 确定性与随机性
- 当代理当前状态的唯一性完全确定代理的下一个状态时,环境被称为确定性的。
- 随机环境本质上是随机的,它不是唯一的,不能完全由代理决定。
- 例子:
国际象棋 -在当前状态下,硬币只有几种可能的走法,并且可以确定这些走法
自动驾驶汽车——自动驾驶汽车的动作不是唯一的,它会不时变化
3. 竞争与合作
- 当一个代理与另一个代理竞争以优化输出时,它被称为处于竞争环境中。
- 国际象棋游戏具有竞争力,因为代理相互竞争以赢得作为输出的游戏。
- 当多个代理合作产生所需的输出时,我们就说一个代理处于协作环境中。
- 当在道路上发现多辆自动驾驶汽车时,它们会相互协作以避免碰撞并到达目的地,这是所需的输出。
4. 单代理 vs 多代理
- 仅由一个代理组成的环境称为单代理环境。
- 一个人独自留在迷宫中是单代理系统的一个例子。
- 涉及多个代理的环境是多代理环境。
- 足球比赛是多智能体的,因为它涉及每支球队的 11 名球员。
5. 动态 vs 静态
- 当代理开始执行某些操作时不断改变自身的环境被称为动态环境。
- 过山车是动态的,因为它开始运动,环境每时每刻都在不断变化。
- 状态没有变化的空闲环境称为静态环境。
- 空房子是静态的,因为当特工进入时,周围环境没有变化。
6. 离散 vs 连续
- 如果一个环境由有限数量的动作组成,这些动作可以在环境中经过深思熟虑以获得输出,则称其为离散环境。
- 国际象棋游戏是离散的,因为它只有有限的步数。每场比赛的移动次数可能会有所不同,但仍然是有限的。
- 执行操作的环境无法编号,即。不是离散的,称为连续的。
- 自动驾驶汽车是连续环境的一个例子,因为它们的动作是驾驶、停车等,无法编号。