📜  人工智能中的环境类型

📅  最后修改于: 2022-05-13 01:58:08.568000             🧑  作者: Mango

人工智能中的环境类型

人工智能中的环境是代理的周围。代理通过传感器从环境中获取输入,并通过执行器将输出传递给环境。有几种类型的环境:

  • 完全可观察 vs 部分可观察
  • 确定性与随机性
  • 竞争与合作
  • 单代理 vs 多代理
  • 静态与动态
  • 离散 vs 连续

1. 完全可观察与部分可观察

  • 当代理传感器能够在每个时间点感知或访问代理的完整状态时,它被称为完全可观察的环境,否则它是部分可观察的。
  • 维护一个完全可观察的环境很容易,因为不需要跟踪周围的历史。
  • 当代理在所有环境中都没有传感器时,该环境被称为不可观察的。
  • 例子:
    • 国际象棋 -棋盘是完全可观察的,对手的动作也是如此
    • 驾驶 -环境是部分可观察的,因为即将发生的事情是未知的。

2. 确定性与随机性

  • 当代理当前状态的唯一性完全确定代理的下一个状态时,环境被称为确定性的。
  • 随机环境本质上是随机的,它不是唯一的,不能完全由代理决定。
  • 例子:
    国际象棋 -在当前状态下,硬币只有几种可能的走法,并且可以确定这些走法
    自动驾驶汽车——自动驾驶汽车的动作不是唯一的,它会不时变化

3. 竞争与合作

  • 当一个代理与另一个代理竞争以优化输出时,它被称为处于竞争环境中。
  • 国际象棋游戏具有竞争力,因为代理相互竞争以赢得作为输出的游戏。
  • 当多个代理合作产生所需的输出时,我们就说一个代理处于协作环境中。
  • 当在道路上发现多辆自动驾驶汽车时,它们会相互协作以避免碰撞并到达目的地,这是所需的输出。

4. 单代理 vs 多代理



  • 仅由一个代理组成的环境称为单代理环境。
  • 一个人独自留在迷宫中是单代理系统的一个例子。
  • 涉及多个代理的环境是多代理环境。
  • 足球比赛是多智能体的,因为它涉及每支球队的 11 名球员。

5. 动态 vs 静态

  • 当代理开始执行某些操作时不断改变自身的环境被称为动态环境。
  • 过山车是动态的,因为它开始运动,环境每时每刻都在不断变化。
  • 状态没有变化的空闲环境称为静态环境。
  • 空房子是静态的,因为当特工进入时,周围环境没有变化。

6. 离散 vs 连续

  • 如果一个环境由有限数量的动作组成,这些动作可以在环境中经过深思熟虑以获得输出,则称其为离散环境。
  • 国际象棋游戏是离散的,因为它只有有限的步数。每场比赛的移动次数可能会有所不同,但仍然是有限的。
  • 执行操作的环境无法编号,即。不是离散的,称为连续的。
  • 自动驾驶汽车是连续环境的一个例子,因为它们的动作是驾驶、停车等,无法编号。