【假期学习计划】深度强化学习算法与应用培训班

深度强化学习应用与实战培训班内容
一、强化学习概述
二、马尔科夫决策过程
1.马尔可夫性
2.马尔可夫决策过程
3.策略与价值
4.最优化原理
5.MDPs扩展
三、动态规划
1.动态规划
2.价值迭代
3.策略迭代
4.迭代策略评估
5.广义策略迭代
6.维数灾
a.python环境下简单扫地机器人环境
b.价值迭代python实现
c.策略迭代python实现
d.迭代策略评估python实现
四、无模型预测学习
1.蒙特卡洛方法
2.时间差分学习
3.n-步回报
4.TD(lambda)
5.资格迹
a.蒙特卡洛方法python实现
b.时间差分方法python实现
五、无模型控制学习
1.蒙特卡洛控制
2.Sarsa
3.重要性采样
4.Q-学习
4.Double Q学习
5.探索与利用
a. Sarsa方法python实现
b. Q学习方法python实现
c. Sarsa(lambda)方法python实现
六、价值函数逼近
1.函数逼近器
2.线性函数逼近
3.常见的特征表示方法
4.价值迭代+离散化方法
5.Fitted Q Iteration
6.策略迭代+最小二乘
7.预测学习+随机梯度下降法
8.控制学习+随机梯度下降法
a. 离散化Q迭代方法python实现
b. LSPI方法python实现
七、策略梯度方法
1.基于策略的强化学习
2.有限差分策略梯度
3.解析法策略梯度
4.REINFORCE算法
5.Actor-Critic
6.策略梯度引入基准
7.自然梯度
8.确定型Actor-Critic
a. 策略迭代方法python实现
b. actor-critic方法python实现
八、深度强化学习
1.Deep Q learning(DQN)
2.Double DQN
3.Dueling DQN
4.Prioritized Experience Replay
5.A3C/A2C
6.DDPG
7.PPO
8.SAC
a.深度强化学习训练场-OpenAI Gym 安装与使用
b.Pytorch安装与使用
实验一：倒立摆和冰壶控制实践
实验二：OpenAI Gym实践
实验：月球飞船降落任务
实验：自动驾驶赛车任务

课程内容咨询联系人：李文强手机：135 2016 2631（微信同号）

深度学习与图神经网络培训班内容
课程内容咨询联系人：李文强手机：135 2016 2631（微信同号）

知识图谱培训班内容

大数据分析挖掘培训班内容

课程内容咨询联系人：李文强手机：135 2016 2631（微信同号）

【假期学习计划】深度强化学习算法与应用培训班相关推荐

【强化学习】深度强化学习入门介绍
深度强化学习是一种机器学习,其中智能体(Agent,也翻译作代理)通过执行操作(Action)和查看结果(Reward)来学习如何在环境中采取最佳的动作或策略. 自 2013 年Deep Q-Lear ...
叶梓老师人工智能培训之强化学习与深度强化学习提纲（强化学习讲师培训）
强化学习与深度强化学习提纲(强化学习讲师培训) 第一天强化学习第一课强化学习综述 1.强化学习要解决的问题 2.强化学习方法的分类 3.强化学习方法的发展趋势 4.环境搭建实验(Gym,Te ...
AI内训讲师叶梓-强化学习与深度强化学习提纲（强化学习讲师培训）
叶梓老师更多教程资料可点击个人主业查看第一天强化学习第一课强化学习综述 1.强化学习要解决的问题 2.强化学习方法的分类 3.强化学习方法的发展趋势 4.环境搭建实验(Gym ...
《ARPG游戏深度强化学习》深度强化学习概念：ARPG0.1世界的构造
深度强化学习概念:ARPG0.1世界的构造背景:决策.计划及更复杂的任务需要更高水平的智能.更强的人工智能系统还需要具备推理.思考和规划能力. 深度学习=深度神经网络+数据平衡+各类体系化的优化算法 ...
重温强化学习之深度强化学习
1.简介输入特征和真实特征相距比较远,加一个深度学习提取源的特征 2.基于值函数的深度强化学习意义:不用函数近似无法解决大规模的问题,用函数近似训练不稳定,首次证明了 ...
深度强化学习和强化学习_深度强化学习：从哪里开始
深度强化学习和强化学习 by Jannes Klaas 简尼斯·克拉斯(Jannes Klaas) 深度强化学习:从哪里开始 (Deep reinforcement learning: where t ...
深度学习stride_深度强化学习成名作——DQN
前言:其实很早之前就想开始写写深度强化学习(Deep reinforcement learning)了,但是一年前DQN没调出来,没好意思写哈哈,最近呢无意中把打砖块游戏Breakout训练到平均分接 ...
基于强化学习与深度强化学习的游戏AI训练
github地址一.摘要在本次大作业中由两个项目组成. 第一个小项目即为简单AI走迷宫游戏,通过强化学习的Q-learning算法,对AI进行训练来让其能以大概率找打一条通关路径并基本按照该路径进 ...
深度强化学习1——强化学习到深度强化学习
从事深度强化学习有一段时间了,整理了网上的一些资料,写几篇博客作为知识的梳理和总结. 开讲前,先给大家看个深度强化学习的例子,下面是深度学习cnn和强化学习结合玩吃豆人的游戏看图像我们会发现吃豆人会 ...
【深度学习】深度强化学习初学者指南
一.说明 GAN(Generative Adversarial Networks)是一种深度学习模型,它由两个神经网络组成:一个生成网络和一个判别网络.生成网络学习如何生成类似于给定数据集的新数据,而 ...

【假期学习计划】深度强化学习算法与应用培训班

【假期学习计划】深度强化学习算法与应用培训班相关推荐

最新文章

热门文章