深度强化学习入坑指南 Updating
正式入坑了,深度强化学习,Deep Reinforcement Learning
愿景是实现通用人工智能
在校期间断断续续学习过一些深度学习相关的内容,强化学习相对来说薄弱一些,不管是理论还是实践,未来一年要恶补了。
任务一 通读ICML DRL最新的论文,对该领域发展有个大概印象
掐指一算,19年还剩下6个月,至少得每周一篇了,第一遍给自己的目标是了解为主,如果有兴趣或者用到了再做深入阅读。
任务二 深度学习理论的系统化学习
过去一年的经验告诉我,系统化学习非常重要,非常重要,坚持系统化的学习,很容易就在以后的工作中展现自己的优势,先求精再追求全,一个人的精力毕竟是很有限的,要足够的聚焦。
深度学习 在线学习的资源
- 吴恩达的deeplearning.ai课程,非常细致,建议认真看认真做作业,打基础
- http://deeplearning.stanford.edu/tutorial/
- http://neuralnetworksanddeeplearning.com/index.html
- http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html
任务三 强化学习理论的系统化学习
- 关注openai官网
- 《Reinforcement Learning:An Introduction》Richard S. Sutton and Andrew G. Barto
- 《深入浅出强化学习:原理入门》还没怎么看,也不知道好不好,比较口语化,适合我入门级读一下
- https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs 各类综述可以加深对DRL应用场景的了解
- 【中文推荐叶强的笔记】https://zhuanlan.zhihu.com/reinforce 正在看《强化学习入门——从原理到实践》-叶强,之前sutton书里没看懂的部分,这里再看一次都理解到位了
任务四 pytorch为主的深度学习框架
代码的功底不能丢,参与实际项目。
继续学习C++ 和 python 以及linux 指令。
我们的目标是
头发留住,早日财务自由!
深度强化学习入坑指南 Updating相关推荐
- 小白深度学习入坑指南
小白深度学习入坑指南 小白深度学习入坑指南 写博客的初衷适合的人群 理论篇 说明 数学 CV ML DL 优化 实践篇 linux python 深度学习框架 框架学习 硬件配置 软件环境配置 常见的 ...
- 强化学习入坑之路04
强化学习入坑之路04 今天继续强化学习的学习,这些内容的学习主要参考了李宏毅的强化学习教程,在此基础上加入了个人的理解和总结.好,废话少说下面开始进入正题. 1.Q-learning(DQN) Sta ...
- 深度强化学习DRL训练指南和现存问题(D3QN(Dueling Double DQN))
目录 参数 iteration episode epoch Batch_Size Experimence Replay Buffer经验回放缓存 Reward discount factor或gamm ...
- tensorflow命令行安装失败_2019-1 强化学习入坑记之ancanda安装
入门RL强化学习,首先要装Tensorflow环境,用ananconda最佳,以此记录我的安装过程 计划: ancanda安装 python3.6 环境设置 tensorflow cpu版本安装 实验 ...
- 深度强化学习落地指南总结(二)-动作空间设计
本系列是对<深度强化学习落地指南>全书的总结,这本书是我市面上看过对深度 强化学习落地讲的最好的一本书,大大拓宽了自己对RL落地思考的维度,形成了强化学习落地分析的一套完整框架,本文内容基 ...
- 【赠书】深度强化学习落地指南,来自一线工程师的经验!
今天要给大家介绍的书是深度强化学习落地指南,本书是海康威视研究院任算法专家工作总结,对强化学习落地实践中的工程经验和相关方法进行了系统归纳. 本书内容 本书一共分为7章,包括强化学习的需求分析和 ...
- 深度强化学习的人工智能在游戏中的运用:游戏AI入门及AI优化指南
前言: 现如今,所有电子游戏都离不开AI的运用,对于游戏策划而言AI是什么,AI又是如何运作,可以说是面试时的加分项,本文在这里不探讨理论的AI(采用深度强化学习的智能AI,如腾讯AI Lab.网易伏 ...
- 深度强化学习落地方法论(8)——新书推荐《深度强化学习落地指南》
知乎原文链接 文章目录 记一次成功的Exploration DRL落地中的"武德"问题 本书的创作理念 关于强化学习 结语 大家好,已经很久没有更新这个专栏了,希望当初关注它的知友 ...
- 深度强化学习落地指南:弥合DRL算法原理和落地实践之间的断层 | 文末送书
魏宁 著 电子工业出版社-博文视点 2021-08-01 ISBN: 9787121416446 定价: 109.00 元 新书推荐 ????今日福利 |关于本书| 本书从工业界一线算法工作者的视角, ...
最新文章
- NumPy学的还不错?来试试这20题
- 【刷算法】整数中1出现的次数(从1到n整数中1出现的次数)
- shiro之AuthenticationStrategy
- Palindrome Linked List
- 清理localstorage_vue 界面刷新数据被清除 localStorage的使用详解
- Reids 批量删除有相同前缀的keys
- 《jQuery Mobile入门经典》—— 2.2 展现CSS样式
- 两个年月下拉列表html,html年月日下拉联动菜单 年月日三下拉框联动
- python在直方图上画折线图_Python 中 plt 画柱状图和折线图
- Vue解决跨域问题之Node反向代理
- 面试经历---YY欢聚时代
- SWT定位– setBounds()或setLocation()
- java peek函数_java (String) s.peek()是什么意思?
- Android加载3D模型的学习笔记
- S3C2440 开发板实战(3):编译概念 + LED点亮闪烁
- switch语句用法
- nextcloud应用_4个Nextcloud必备编写应用程序
- 一文读懂如何用python调用matlab函数(windows环境)
- 说说PSTN、ISDN、 ADSL三种互联网接入方式的区别。
- Jmter的接口测试提升篇
热门文章
- 计算机毕业设计JAVA的影视资讯管理系统mybatis+源码+调试部署+系统+数据库+lw
- 用PE系统中虚拟光驱进行MSDN XP系统安装
- jQuery Mobile 过渡效果
- python中item是什么意思中文-Python中使用item()方法遍历字典的例子
- 暴利项目创业, 是未来最赚钱的行业, 很多人根本看不见
- 扫地机器人湿地_石头扫地机器人体验:拖地更方便更好了,能给爸妈买吗?| 验货...
- php查询获取经纬度的详细信息-腾讯地图
- 【Go】超详细Go入门
- vue 防止页面后退
- matlab中的repmat函数