文章目录

  • Agent及其理性
    • 理性的概念
  • PEAS及环境特性
  • Agent的结构
  • Agent程序的部件如何运转
  • 小结
  • 资源分享

Agent及其理性

Agent:通过传感器感知所处环境并通过执行器对该环境产生作用的智能体
Agent感知序列:该Agent所接收到的是所有输入数据的完整历史
感知信息:智能体的感知输入
感知序列:感知信息的集合
Agent函数:描述Agent行为,将任意给定感知序列映射为行动
Agent程序:实现Agent函数

The agent function describes what the agent does in all circumstances
The agent program calculates the agent function

理性的概念

理性:Agent的一种属性,考虑到迄今为止的感知,他们选择能够最大化其预期效用的行为。
理性(Rationality)Agent:对于每个可能的感知序列,根据已知的序列提供的证据和智能体内建的先验知识,理性智能体应该选择期望能使其性能最大化的行动。
Rationality depends on:

  • The performance measure that defines the criterion of success
  • The agent’s prior knowledge of the environment
  • The actions that the agent can perform
  • The agent’s percept sequence to date
    性能度量、先验知识、可执行行动、感知序列

全知Agent:全知Agent明确知道他的行动产生的实际结果并做出相应的动作,现实中不可能。理性 ≠ 全知
完美Agent:理性Agent使期望性能最大化;完美Agent使实际性能最大化。理性 ≠ 完美

理性Agent还应该是自主的,它应该学习,以弥补不完整的或者不正确的先验知识。

PEAS及环境特性

任务环境的规范包括:
To design a rational agent we need to specify a task environment

  • Performance measure
  • Environment
  • Actuators
  • Sensors

PEAS(性能Performance,环境 Environment, 执行器Actuators, 传感器Sensors)

例如,在Spam Filtering垃圾邮件过滤中

  • Performance measure: spam block
  • Environment: email client or server
  • Actuators: mark as spam, transfer messages
  • Sensors: emails (possibly across users), etc.

任务环境的属性

  • 完全可观测和部分可观测
    Agent的Sensors在每个时间点上都能获取环境的完整状态。若监测到的信息与行动决策相关,则该任务环境是有效完全可观察的。
  • 单Agent和多Agent
  • 确定的和随机的
  • 片段式的和延续式的
    片段:下一个片段不依赖于以前片段采取的行动(如大部分的分类任务)。
    连续:当前决策会影响到所有未来决策。
  • 静态的和动态的
    取决于环境在Agent计算时是否会改变。
  • 离散的和连续的
    环境状态,时间处理方式,Agent感知信息和行动 都有离散和连续之分。

Agent的结构

Agent = 体系结构 + 程序(Agent程序)
体系结构,具有物理传感器和执行器的计算装置
智能体程序,每接收到一个新的感知信息,就将其添加到感知序列中,并根据先验知识的对应表得到一个行动,把传感器的感知信息映射到行动的Agent函数

All agents have the same skeleton

  • Input = current percepts
  • Output = action
  • Program= manipulates input to produce
    output

Four basic types in order of increasing generality

  • Simple reflex agents 简单反射agent,忽略感知序列,而只针对当前感知选择行动。
  • Model-based reflex agents 基于模型的agent
  • Goal-based agents 基于目标的agent
    基于目标的agent会考虑将要采取的行动及行动的后果,即与目标还有多远
  • Utility-based agents 基于效用的agent,最大化期望
  • Learning agents 学习agent
    All these can be turned into learning agents

Agent程序的部件如何运转

各部件的工作

  • 原子表示
  • 要素化表示(状态有特征向量)
  • 结构化表示(特征向量+其他对象的关系)

小结

要点回顾如卜:
Agent是可以感知环境并在环境中行动的事物。
Agent函数指定Agent响应任何感知序列所采取的行动。

性能度量评价Agent在环境中的行为表现。给定Agent的感知序列,理性Agent行动追求性能度量预期值最大化

任务环境的规范包括性能度量,外部环境,执行器和传感器。设计Agent时,第一步总是把任务空间定义得尽可能完全。

任务环境从不同的维度看有很多变化。它们可能是完全或部分可观察的,单Agent或多Agent的,确定性的或随机的,片段式的或延续式的,静态的或动态的,离散的或连续的,已知的和未知的。

Agent程序是Agent函数的实现。 有各种基本的Agent程序的设计,反映出显式表
现的以及用于决策过程的信息种类。设计可能在效率、压缩性和灵活性方面有变化。适当的 Agent 程序的设计依赖于环境的本性。

简单反射Agent直接对感知信息做出反应。基于模型的反射Agent保持内部状态,其操作直接从当前世界状态的内部模型派生,并随时间更新。基于目标的Agent选择能实现显示表示的目标的动作,而基于效用的Agent试图选择能最大化它期望效用的动作。

所有Agent都可以通过学习来改进它们性能。

资源分享

实验代码下载:
https://github.com/yyl424525/AI_Homework
人工智能-一种现代方法中文第三版pdf、课件、作业及解答、课后习题答案、实验代码和报告、历年考博题下载:https://download.csdn.net/download/yyl424525/11310392

人工智能 一种现代方法 第2章 智能Agent相关推荐

  1. 人工智能 一种现代方法 第10章 经典的规划问题(classical planning)

    文章目录 规划问题定义(PDDL)为一个搜索问题 状态空间搜索规划算法 前向状态空间搜索 后向相关状态搜索 规划的启发式 资源分享 本文旨在讲明: 1)规划问题定义(PDDL)为一个搜索问题 2)前向 ...

  2. 人工智能 一种现代方法 第11章 现实世界的规划与行动

    文章目录 时间.调度和资源 车间调度问题 忽略资源约束的时间调度问题:关键路径方法 有资源约束的时间调度问题 分层规划 搜索原语解 搜索抽象解 非确定性问题的规划 无传感器规划 应急规划 资源分享 本 ...

  3. 人工智能 一种现代方法 第14章 概论推理

    文章目录 贝叶斯网络 贝叶斯网络是什么 一种构造贝叶斯网络的方法 条件分布的有效表示 贝叶斯网络的精确推理 推理任务 通过枚举进行推理 变量消元算法(避免重复计算) 贝叶斯网络的近似推理 直接采样 似 ...

  4. 人工智能 一种现代方法 第5章 对抗搜索

    文章目录 博弈 博弈中的优化决策 Minmax算法(极小极大算法) 多人博弈时的最优决策 α-β剪枝(重点) 不完美的实时决策 评估函数 截断搜索 向前剪枝 资源分享 博弈 对抗搜索:竞争环境中每个A ...

  5. 人工智能第2章 智能 Agent

    第2章 智能 Agent Agent通过传感器感知环境并通过执行器执行动作反馈到环境. ​​​​​​ AI的任务是设计Agent程序,实现把感知信息映射到行动的Agent函数. Agent就是能够行动 ...

  6. [转载] 人工智能:一种现代方法——第1章 绪论

    转载于:https://www.cnblogs.com/6DAN_HUST/archive/2012/06/24/2560216.html

  7. NO.74——《人工智能·一种现代方法》通过搜索进行问题求解 学习笔记

    问题求解Agent 如何将问题形式化?(以罗马尼亚案例为例) 初始状态:In(Arad) 行动:ACTIONS(s),即,给定一个状态s,ACTIONS(s)返回状态s下可以执行的动作的集合.例如状态 ...

  8. NO.73——《人工智能·一种现代方法》Agent学习笔记

    Agent 首先,何为Agent?通过传感器感知环境,并通过执行器对所处环境产生影响. Agent的感知序列:是该Agent存储的所有输入历史的完整数据. Agent函数 Agent函数是抽象的数学描 ...

  9. 《人工智能-一种现代方法》笔记

    第一章 什么是人工智能 AI 是行动还是思考

  10. 人工智能提纲式汇总+简要分析 可用于复习《人工智能——一种现代的方法》

    文章目录 人工智能 第一章 什么是AI 第二章 智能Agent 理性AI的任务环境的规范描述 第三章 通过搜索进行问题求解 1.搜索树 BFS 宽度优先搜索 UCS 一致代价搜索 DFS 深度优先算法 ...

最新文章

  1. 固态器件理论(4)电子和“空穴”
  2. druid连接池_c3p0、dbcp、druid 三大连接池对比
  3. 数据结构(2) -- 线性表的顺序表示
  4. NYOJ-摆方格(贪心)
  5. 结构体 内存对齐 keil STM32
  6. 学习笔记|Pytorch使用教程22(hook函数与CAM可视化)
  7. 计算机怎么调整桌面图标的大小,电脑显示器屏幕图标大小如何设置_电脑显示屏内图标大小怎么调...
  8. 计算机专业普通的期刊,计算机类的普通期刊
  9. mysql io线程 原理_MySQL IO线程及相关参数调优
  10. Mock实现单元测试报错:Argument passed to when( ) is not a mock!
  11. 一种Ansys安装 “Ans.SceneGraphChart.SceneGraphAddin. The software will exit.“报错解决方案
  12. 在c语言中 char型数据在内存中的存储形式是,在c语言中char型数据在内存中的存储形式是什么?...
  13. 数据挖掘之OneR算法(原来数据挖掘如此简单!)
  14. 32位浮点数转十进制与二进制
  15. 计算机科学属于sci核心吗,SCI属于核心期刊吗
  16. 前端想自学后找个小公司混口饭吃,需要学到什么程度?
  17. PHP发送文件到JAVA项目
  18. Fast Global Registration(快速全局配准)
  19. 这家国产芯片的崛起,叫板美日韩芯片企业
  20. 回顾2018年圆齿轮流量计行业发展现状

热门文章

  1. js 正则表达式大全 数字、字符等
  2. 基于cesium的三维城市建筑可视化系统(shp数据导入cesium的三种可行方法)
  3. CAD 卸载工具,完美彻底卸载清除干净cad各种残留注册表和文件
  4. 《创新者的窘境》读书笔记
  5. Web浏览器没有Flash如何播放RTMP协议直播
  6. 国家信息安全漏洞库最新动态发布,墨云科技成为CNNVD技术支撑单位
  7. 安卓游戏广告加速插件_游戏加速器(强烈推荐!)[PC+安卓]
  8. WMS仓储管理系统解决方案
  9. 5G及移动边缘计算(MEC)学习笔记(2)
  10. 网页版excel数据批量导入数据库