📜  PEAS 任务环境描述

📅  最后修改于: 2022-05-13 01:58:09.037000             🧑  作者: Mango

PEAS 任务环境描述

我们需要描述“在拍卖中竞标”活动的 PEAS。

PEAS 代表性能测量、环境、执行器和传感器。我们将看到这些术语各自的含义。

  • 性能指标:这些是用于衡量代理性能的参数。代理执行特定分配任务的情况。
  • 环境:是代理的任务环境。代理与其环境进行交互。它从输入中获取感知输入,并使用执行器作用于环境。
  • 执行器:这些是对环境执行计算操作的方法。对于人工代理;手和腿是执行器。
  • 传感器:这些是从环境中获取输入的方法。对于人工代理;耳朵、眼睛和鼻子是传感器。

让我们回到拍卖活动。

绩效指标:

  1. 项目成本
  2. 商品质量
  3. 物品的价值
  4. 物品的必要性

环境:

  1. 拍卖
  2. 投标人
  3. 投标人要投标的项目

执行器:(表示执行活动)

  1. 扬声器
  2. 麦克风
  3. 显示项目
  4. 预算

传感器:(感知环境的意思)

  1. 相机
  2. 价格监视器,显示价格。
  3. 眼睛
  4. 与会者的耳朵。

此外,我们将看到该代理的属性。

  1. 可观察(完全/部分):这是一个部分可观察的环境。当一个代理不能在所有时间点确定环境的完整状态时,它被称为部分可观察环境。在这里,拍卖代理不能在所有时间点完全了解环境状态。简单地说,我们可以说,无论在任务环境中,无论代理必须与人类打交道,它都无法完全观察状态。
  2. Agents (Single/Multi):是单代理活动。因为只有一个代理参与到这个环境中并且自己运行。该活动还涉及其他人类代理,但他们都将他们的感知序列传递给中央代理——我们的拍卖代理。因此,它仍然是单代理环境。
  3. 确定性(Deterministic/Stochastic):是随机活动。因为在投标中,不能根据代理的特定状态来确定结果。这是结果涉及一些随机性并具有一些不确定性的过程
  4. 情节(Episodic/Sequential):它是一个顺序任务环境。在情节环境中,情节是相互独立的。在一个情节中执行的操作不会影响后续情节。在拍卖活动中,如果一个投标人设置了 X 值,那么下一个投标人不能设置小于 X 的值。因此,这里的情节不是独立的。因此,它是一个连续的活动。环境存在高度不确定性。
  5. 静态(Static/Semi/Dynamic):是一种动态活动。静态活动是环境的一种特定状态不随时间变化的活动。但在拍卖活动中,各州对变化的主观性很强。静态环境是数字不变的填字游戏。
  6. 离散(Discrete/Continuous):是一种连续的活动。离散环境是具有有限数量状态的环境。但在拍卖活动中,投标人可以永远设定价值。状态数可以是 1 或 1000。环境中存在随机性。因此,它是一个连续的环境。

2、PEAS对“网购代购”的描述

我们需要为“在 Internet 上购买 DataWarehousing 书籍”活动描述 PEAS。

绩效指标:

  • 书的价格
  • 本书作者
  • 书的质量
  • 谷歌上的书评。
  • 获取感兴趣/想要的书籍。
  • 成本最小化。

环境:

  • 互联网网站。
  • 特定网站的网页
  • 供应商/卖家
  • 托运人

执行器:

  • 填写表格。
  • 向用户展示
  • 关注网址

传感器:

  • 键盘输入
  • 用于查找网页的浏览器
  • HTML

此外,我们将看到该代理的属性。

1. Observable (Fully or Partial):这个环境是部分可观察的。当一个代理不能在所有时间点确定环境的完整状态时,它被称为部分可观察环境。

在这里,购物代理无法在一个网页中查看所有类型的书籍。例如,在当前网页中,所有书籍的评分和价格都相似。如果用户想要查看高评分的书籍,那么代理必须关注不同的网页或在搜索栏中设置过滤器。因此,代理正在与部分可观察的环境进行交互。

2.确定性或非确定性:环境是确定性的。如果当前状态和在当前状态中执行的动作完全确定了下一个状态,则称任务环境是确定性的,否则为非确定性任务环境。

在这里,如果购物代理喜欢一本书并想购买它,那么同一本书将遵循下一个状态。接下来的状态将是:付款,填写送货地址和订单确认。代理商将只为所选书籍付款。因此,下一个状态由当前状态决定。

3. 情节/顺序:这是一个顺序环境。如果一个环境由独立的情节组成,并且在一个情节中执行的动作不会影响其他情节,则称该环境是情节性的。在顺序环境中,在当前状态下执行的动作会影响下一个状态。

在这里,如果当前书被代理拒绝,那么代理将不会再看到同一本书。一旦被代理拒绝,该网页将不再显示同一本书。因此,当前状态的动作完全改变了下一个可能的状态。

4.静态/动态:是静态环境。如果环境不随时间变化,那么它就是静态的。汽车驾驶环境是动态的,因为车辆是连续运行的。经纪人不知道接下来会发生什么。但是在静态环境中,一个特定的状态随着时间的推移是完全不可改变的,就像网页一样。

在这里,书籍的详细信息或网站上显示的书籍列表不会随着时间的推移而改变。这本书的细节不依赖于代理人的行动。

5.离散/连续:这是一个离散的环境。如果环境由有限数量的状态组成,则它是离散的。下棋环境是离散的,而汽车驾驶环境是连续的。

这里,状态的数量是有限的。可能的状态是:

  • 看书详情
  • 看价格
  • 填表格
  • 下订单并付款。

6. Single-agent/Multi-agent :单代理系统。只有一个代理与环境交互,环境中不存在其他机器人或 AI 代理。如果只有一个代理在其上进行交互和操作,则称环境为单代理环境,否则为多代理。下棋环境是多智能体,因为下棋需要两个智能体(人类或机器人)。

在这里,只有购物代理在网站上起作用。