深度强化学习应用与实战培训班内容
一、强化学习概述
二、马尔科夫决策过程
1.马尔可夫性
2.马尔可夫决策过程
3.策略与价值
4.最优化原理
5.MDPs扩展
三、动态规划
1.动态规划
2.价值迭代
3.策略迭代
4.迭代策略评估
5.广义策略迭代
6.维数灾
a.python环境下简单扫地机器人环境
b.价值迭代python实现
c.策略迭代python实现
d.迭代策略评估python实现
四、无模型预测学习
1.蒙特卡洛方法
2.时间差分学习
3.n-步回报
4.TD(lambda)
5.资格迹
a.蒙特卡洛方法python实现
b.时间差分方法python实现
五、无模型控制学习
1.蒙特卡洛控制
2.Sarsa
3.重要性采样
4.Q-学习
4.Double Q学习
5.探索与利用
a. Sarsa方法python实现
b. Q学习方法python实现
c. Sarsa(lambda)方法python实现
六、价值函数逼近
1.函数逼近器
2.线性函数逼近
3.常见的特征表示方法
4.价值迭代+离散化方法
5.Fitted Q Iteration
6.策略迭代+最小二乘
7.预测学习+随机梯度下降法
8.控制学习+随机梯度下降法
a. 离散化Q迭代方法python实现
b. LSPI方法python实现
七、策略梯度方法
1.基于策略的强化学习
2.有限差分策略梯度
3.解析法策略梯度
4.REINFORCE算法
5.Actor-Critic
6.策略梯度引入基准
7.自然梯度
8.确定型Actor-Critic
a. 策略迭代方法python实现
b. actor-critic方法python实现
八、深度强化学习
1.Deep Q learning(DQN)
2.Double DQN
3.Dueling DQN
4.Prioritized Experience Replay
5.A3C/A2C
6.DDPG
7.PPO
8.SAC
a.深度强化学习训练场-OpenAI Gym 安装与使用
b.Pytorch安装与使用
实验一:倒立摆和冰壶控制实践
实验二:OpenAI Gym实践
实验:月球飞船降落任务
实验:自动驾驶赛车任务

课程内容 咨询 联系人:李文强 手机:135 2016 2631(微信同号)


深度学习与图神经网络培训班内容
课程内容 咨询 联系人:李文强 手机:135 2016 2631(微信同号)




知识图谱培训班内容


大数据分析挖掘培训班内容


课程内容 咨询 联系人:李文强 手机:135 2016 2631(微信同号)

【假期学习计划】深度强化学习算法与应用培训班相关推荐

  1. 【强化学习】深度强化学习入门介绍

    深度强化学习是一种机器学习,其中智能体(Agent,也翻译作代理)通过执行操作(Action)和查看结果(Reward)来学习如何在环境中采取最佳的动作或策略. 自 2013 年Deep Q-Lear ...

  2. 叶梓老师人工智能培训之强化学习与深度强化学习提纲(强化学习讲师培训)

    强化学习与深度强化学习提纲(强化学习讲师培训) 第一天 强化学习   第一课 强化学习综述 1.强化学习要解决的问题 2.强化学习方法的分类 3.强化学习方法的发展趋势 4.环境搭建实验(Gym,Te ...

  3. AI内训讲师叶梓-强化学习与深度强化学习提纲(强化学习讲师培训)

    叶梓老师更多教程资料可点击个人主业​​​​​​​查看 第一天 强化学习   第一课 强化学习综述 1.强化学习要解决的问题 2.强化学习方法的分类 3.强化学习方法的发展趋势 4.环境搭建实验(Gym ...

  4. 《ARPG游戏深度强化学习 》深度强化学习概念:ARPG0.1世界的构造

    深度强化学习概念:ARPG0.1世界的构造 背景:决策.计划及更复杂的任务需要更高水平的智能.更强的人工智能系统还需要具备推理.思考和规划能力. 深度学习=深度神经网络+数据平衡+各类体系化的优化算法 ...

  5. 重温强化学习之深度强化学习

    1.简介                输入特征和真实特征相距比较远,加一个深度学习提取源的特征 2.基于值函数的深度强化学习 意义:不用函数近似无法解决大规模的问题,用函数近似训练不稳定,首次证明了 ...

  6. 深度强化学习和强化学习_深度强化学习:从哪里开始

    深度强化学习和强化学习 by Jannes Klaas 简尼斯·克拉斯(Jannes Klaas) 深度强化学习:从哪里开始 (Deep reinforcement learning: where t ...

  7. 深度学习stride_深度强化学习成名作——DQN

    前言:其实很早之前就想开始写写深度强化学习(Deep reinforcement learning)了,但是一年前DQN没调出来,没好意思写哈哈,最近呢无意中把打砖块游戏Breakout训练到平均分接 ...

  8. 基于强化学习与深度强化学习的游戏AI训练

    github地址 一.摘要 在本次大作业中由两个项目组成. 第一个小项目即为简单AI走迷宫游戏,通过强化学习的Q-learning算法,对AI进行训练来让其能以大概率找打一条通关路径并基本按照该路径进 ...

  9. 深度强化学习1——强化学习到深度强化学习

    从事深度强化学习有一段时间了,整理了网上的一些资料,写几篇博客作为知识的梳理和总结. 开讲前,先给大家看个深度强化学习的例子,下面是深度学习cnn和强化学习结合玩吃豆人的游戏 看图像我们会发现吃豆人会 ...

  10. 【深度学习】深度强化学习初学者指南

    一.说明 GAN(Generative Adversarial Networks)是一种深度学习模型,它由两个神经网络组成:一个生成网络和一个判别网络.生成网络学习如何生成类似于给定数据集的新数据,而 ...

最新文章

  1. C语言中 sscanf 的用法
  2. 2020-11-6(简述html)
  3. javaone_JavaOne 2015:高级模块化开发
  4. Convirt管理机Socat驻留进程故障处理
  5. 转载防火墙和防毒墙的区别
  6. c# splitContainer 中间的分割线问题
  7. 菏泽职业学院计算机专业代码,菏泽家政职业学院代码及专业代码
  8. 个人发卡网站源码运营版 内置4套模板
  9. matlab 柯西黎曼方程,解析函数及柯西黎曼方程.ppt
  10. 车轱辘APP提交到各应用市场的心得~
  11. 一个数字几个字节_字节跳动安全沙龙闭幕 多位专家解析数字经济业务安全
  12. 天正服务器不显示,天正画图的时候图形消失看不见了怎么办?
  13. 怎么把线稿提取出来_PS怎么扣抠线稿?Adobe Photoshop CS6如何提取清晰的线稿
  14. Android修行手册 - 实现可折叠TextView,仅一个类复制即用
  15. 网上舆情分析报告写作框架及六大技巧
  16. linux上远程文件传输工具 scp sz rz
  17. 第2章 感知机 - 对偶形式
  18. 洗地机充电底座语音芯片选型?NV040DS语音芯片
  19. python培训 马哥 教室
  20. Navicat Premium(数据库管理) 15.0.18 pojie版

热门文章

  1. 使用CDN后网页无法访问怎么解决
  2. 工测中坐标方位角的计算c语言,工程测量中坐标方位角是怎么进行推算的?
  3. spectral clustering谱聚类论文解读(上)
  4. 微型计算机的英文术语,计算机常见英语词汇解释
  5. 网格布局(固定单元格间隔,单元格、容器大小不定)布局使用
  6. 狄利克雷分布公式_潜在狄利克雷分配(LDA)
  7. java锁 -- 自旋锁
  8. PTA-链表学习-----奇数值结点链表
  9. (项目名).exe”。已加载符号。 无法查找或打开 PDB 文件。
  10. 活水决策体系七:辩证思维之三大规律