人工智能 一种现代方法 第2章 智能Agent
文章目录
- Agent及其理性
- 理性的概念
- PEAS及环境特性
- Agent的结构
- Agent程序的部件如何运转
- 小结
- 资源分享
Agent及其理性
Agent:通过传感器感知所处环境并通过执行器对该环境产生作用的智能体
Agent感知序列:该Agent所接收到的是所有输入数据的完整历史
感知信息:智能体的感知输入
感知序列:感知信息的集合
Agent函数:描述Agent行为,将任意给定感知序列映射为行动
Agent程序:实现Agent函数
The agent function describes what the agent does in all circumstances
The agent program calculates the agent function
理性的概念
理性:Agent的一种属性,考虑到迄今为止的感知,他们选择能够最大化其预期效用的行为。
理性(Rationality)Agent:对于每个可能的感知序列,根据已知的序列提供的证据和智能体内建的先验知识,理性智能体应该选择期望能使其性能最大化的行动。
Rationality depends on:
- The performance measure that defines the criterion of success
- The agent’s prior knowledge of the environment
- The actions that the agent can perform
- The agent’s percept sequence to date
性能度量、先验知识、可执行行动、感知序列
全知Agent:全知Agent明确知道他的行动产生的实际结果并做出相应的动作,现实中不可能。理性 ≠ 全知
完美Agent:理性Agent使期望性能最大化;完美Agent使实际性能最大化。理性 ≠ 完美
理性Agent还应该是自主的,它应该学习,以弥补不完整的或者不正确的先验知识。
PEAS及环境特性
任务环境的规范包括:
To design a rational agent we need to specify a task environment
- Performance measure
- Environment
- Actuators
- Sensors
PEAS(性能Performance,环境 Environment, 执行器Actuators, 传感器Sensors)
例如,在Spam Filtering垃圾邮件过滤中
- Performance measure: spam block
- Environment: email client or server
- Actuators: mark as spam, transfer messages
- Sensors: emails (possibly across users), etc.
任务环境的属性
- 完全可观测和部分可观测
Agent的Sensors在每个时间点上都能获取环境的完整状态。若监测到的信息与行动决策相关,则该任务环境是有效完全可观察的。 - 单Agent和多Agent
- 确定的和随机的
- 片段式的和延续式的
片段:下一个片段不依赖于以前片段采取的行动(如大部分的分类任务)。
连续:当前决策会影响到所有未来决策。 - 静态的和动态的
取决于环境在Agent计算时是否会改变。 - 离散的和连续的
环境状态,时间处理方式,Agent感知信息和行动 都有离散和连续之分。
Agent的结构
Agent = 体系结构 + 程序(Agent程序)
体系结构,具有物理传感器和执行器的计算装置
智能体程序,每接收到一个新的感知信息,就将其添加到感知序列中,并根据先验知识的对应表得到一个行动,把传感器的感知信息映射到行动的Agent函数
All agents have the same skeleton
- Input = current percepts
- Output = action
- Program= manipulates input to produce
output
Four basic types in order of increasing generality
- Simple reflex agents 简单反射agent,忽略感知序列,而只针对当前感知选择行动。
- Model-based reflex agents 基于模型的agent
- Goal-based agents 基于目标的agent
基于目标的agent会考虑将要采取的行动及行动的后果,即与目标还有多远 - Utility-based agents 基于效用的agent,最大化期望
- Learning agents 学习agent
All these can be turned into learning agents
Agent程序的部件如何运转
各部件的工作
- 原子表示
- 要素化表示(状态有特征向量)
- 结构化表示(特征向量+其他对象的关系)
小结
要点回顾如卜:
Agent是可以感知环境并在环境中行动的事物。
Agent函数指定Agent响应任何感知序列所采取的行动。
性能度量评价Agent在环境中的行为表现。给定Agent的感知序列,理性Agent行动追求性能度量预期值最大化。
任务环境的规范包括性能度量,外部环境,执行器和传感器。设计Agent时,第一步总是把任务空间定义得尽可能完全。
任务环境从不同的维度看有很多变化。它们可能是完全或部分可观察的,单Agent或多Agent的,确定性的或随机的,片段式的或延续式的,静态的或动态的,离散的或连续的,已知的和未知的。
Agent程序是Agent函数的实现。 有各种基本的Agent程序的设计,反映出显式表
现的以及用于决策过程的信息种类。设计可能在效率、压缩性和灵活性方面有变化。适当的 Agent 程序的设计依赖于环境的本性。
简单反射Agent直接对感知信息做出反应。基于模型的反射Agent保持内部状态,其操作直接从当前世界状态的内部模型派生,并随时间更新。基于目标的Agent选择能实现显示表示的目标的动作,而基于效用的Agent试图选择能最大化它期望效用的动作。
所有Agent都可以通过学习来改进它们性能。
资源分享
实验代码下载:
https://github.com/yyl424525/AI_Homework
人工智能-一种现代方法中文第三版pdf、课件、作业及解答、课后习题答案、实验代码和报告、历年考博题下载:https://download.csdn.net/download/yyl424525/11310392
人工智能 一种现代方法 第2章 智能Agent相关推荐
- 人工智能 一种现代方法 第10章 经典的规划问题(classical planning)
文章目录 规划问题定义(PDDL)为一个搜索问题 状态空间搜索规划算法 前向状态空间搜索 后向相关状态搜索 规划的启发式 资源分享 本文旨在讲明: 1)规划问题定义(PDDL)为一个搜索问题 2)前向 ...
- 人工智能 一种现代方法 第11章 现实世界的规划与行动
文章目录 时间.调度和资源 车间调度问题 忽略资源约束的时间调度问题:关键路径方法 有资源约束的时间调度问题 分层规划 搜索原语解 搜索抽象解 非确定性问题的规划 无传感器规划 应急规划 资源分享 本 ...
- 人工智能 一种现代方法 第14章 概论推理
文章目录 贝叶斯网络 贝叶斯网络是什么 一种构造贝叶斯网络的方法 条件分布的有效表示 贝叶斯网络的精确推理 推理任务 通过枚举进行推理 变量消元算法(避免重复计算) 贝叶斯网络的近似推理 直接采样 似 ...
- 人工智能 一种现代方法 第5章 对抗搜索
文章目录 博弈 博弈中的优化决策 Minmax算法(极小极大算法) 多人博弈时的最优决策 α-β剪枝(重点) 不完美的实时决策 评估函数 截断搜索 向前剪枝 资源分享 博弈 对抗搜索:竞争环境中每个A ...
- 人工智能第2章 智能 Agent
第2章 智能 Agent Agent通过传感器感知环境并通过执行器执行动作反馈到环境. AI的任务是设计Agent程序,实现把感知信息映射到行动的Agent函数. Agent就是能够行动 ...
- [转载] 人工智能:一种现代方法——第1章 绪论
转载于:https://www.cnblogs.com/6DAN_HUST/archive/2012/06/24/2560216.html
- NO.74——《人工智能·一种现代方法》通过搜索进行问题求解 学习笔记
问题求解Agent 如何将问题形式化?(以罗马尼亚案例为例) 初始状态:In(Arad) 行动:ACTIONS(s),即,给定一个状态s,ACTIONS(s)返回状态s下可以执行的动作的集合.例如状态 ...
- NO.73——《人工智能·一种现代方法》Agent学习笔记
Agent 首先,何为Agent?通过传感器感知环境,并通过执行器对所处环境产生影响. Agent的感知序列:是该Agent存储的所有输入历史的完整数据. Agent函数 Agent函数是抽象的数学描 ...
- 《人工智能-一种现代方法》笔记
第一章 什么是人工智能 AI 是行动还是思考
- 人工智能提纲式汇总+简要分析 可用于复习《人工智能——一种现代的方法》
文章目录 人工智能 第一章 什么是AI 第二章 智能Agent 理性AI的任务环境的规范描述 第三章 通过搜索进行问题求解 1.搜索树 BFS 宽度优先搜索 UCS 一致代价搜索 DFS 深度优先算法 ...
最新文章
- 固态器件理论(4)电子和“空穴”
- druid连接池_c3p0、dbcp、druid 三大连接池对比
- 数据结构(2) -- 线性表的顺序表示
- NYOJ-摆方格(贪心)
- 结构体 内存对齐 keil STM32
- 学习笔记|Pytorch使用教程22(hook函数与CAM可视化)
- 计算机怎么调整桌面图标的大小,电脑显示器屏幕图标大小如何设置_电脑显示屏内图标大小怎么调...
- 计算机专业普通的期刊,计算机类的普通期刊
- mysql io线程 原理_MySQL IO线程及相关参数调优
- Mock实现单元测试报错:Argument passed to when( ) is not a mock!
- 一种Ansys安装 “Ans.SceneGraphChart.SceneGraphAddin. The software will exit.“报错解决方案
- 在c语言中 char型数据在内存中的存储形式是,在c语言中char型数据在内存中的存储形式是什么?...
- 数据挖掘之OneR算法(原来数据挖掘如此简单!)
- 32位浮点数转十进制与二进制
- 计算机科学属于sci核心吗,SCI属于核心期刊吗
- 前端想自学后找个小公司混口饭吃,需要学到什么程度?
- PHP发送文件到JAVA项目
- Fast Global Registration(快速全局配准)
- 这家国产芯片的崛起,叫板美日韩芯片企业
- 回顾2018年圆齿轮流量计行业发展现状