正式入坑了,深度强化学习,Deep Reinforcement Learning

愿景是实现通用人工智能

在校期间断断续续学习过一些深度学习相关的内容,强化学习相对来说薄弱一些,不管是理论还是实践,未来一年要恶补了。

任务一 通读ICML DRL最新的论文,对该领域发展有个大概印象


掐指一算,19年还剩下6个月,至少得每周一篇了,第一遍给自己的目标是了解为主,如果有兴趣或者用到了再做深入阅读。

任务二 深度学习理论的系统化学习

过去一年的经验告诉我,系统化学习非常重要,非常重要,坚持系统化的学习,很容易就在以后的工作中展现自己的优势,先求精再追求全,一个人的精力毕竟是很有限的,要足够的聚焦。

深度学习 在线学习的资源
  • 吴恩达的deeplearning.ai课程,非常细致,建议认真看认真做作业,打基础
  • http://deeplearning.stanford.edu/tutorial/
  • http://neuralnetworksanddeeplearning.com/index.html
  • http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html

任务三 强化学习理论的系统化学习

  • 关注openai官网
  • 《Reinforcement Learning:An Introduction》Richard S. Sutton and Andrew G. Barto
  • 《深入浅出强化学习:原理入门》还没怎么看,也不知道好不好,比较口语化,适合我入门级读一下
  • https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs 各类综述可以加深对DRL应用场景的了解
  • 【中文推荐叶强的笔记】https://zhuanlan.zhihu.com/reinforce 正在看《强化学习入门——从原理到实践》-叶强,之前sutton书里没看懂的部分,这里再看一次都理解到位了

任务四 pytorch为主的深度学习框架

代码的功底不能丢,参与实际项目。
继续学习C++ 和 python 以及linux 指令。


我们的目标是

头发留住,早日财务自由!

深度强化学习入坑指南 Updating相关推荐

  1. 小白深度学习入坑指南

    小白深度学习入坑指南 小白深度学习入坑指南 写博客的初衷适合的人群 理论篇 说明 数学 CV ML DL 优化 实践篇 linux python 深度学习框架 框架学习 硬件配置 软件环境配置 常见的 ...

  2. 强化学习入坑之路04

    强化学习入坑之路04 今天继续强化学习的学习,这些内容的学习主要参考了李宏毅的强化学习教程,在此基础上加入了个人的理解和总结.好,废话少说下面开始进入正题. 1.Q-learning(DQN) Sta ...

  3. 深度强化学习DRL训练指南和现存问题(D3QN(Dueling Double DQN))

    目录 参数 iteration episode epoch Batch_Size Experimence Replay Buffer经验回放缓存 Reward discount factor或gamm ...

  4. tensorflow命令行安装失败_2019-1 强化学习入坑记之ancanda安装

    入门RL强化学习,首先要装Tensorflow环境,用ananconda最佳,以此记录我的安装过程 计划: ancanda安装 python3.6 环境设置 tensorflow cpu版本安装 实验 ...

  5. 深度强化学习落地指南总结(二)-动作空间设计

    本系列是对<深度强化学习落地指南>全书的总结,这本书是我市面上看过对深度 强化学习落地讲的最好的一本书,大大拓宽了自己对RL落地思考的维度,形成了强化学习落地分析的一套完整框架,本文内容基 ...

  6. 【赠书】深度强化学习落地指南,来自一线工程师的经验!

    ‍‍ 今天要给大家介绍的书是深度强化学习落地指南,本书是海康威视研究院任算法专家工作总结,对强化学习落地实践中的工程经验和相关方法进行了系统归纳. 本书内容 本书一共分为7章,包括强化学习的需求分析和 ...

  7. 深度强化学习的人工智能在游戏中的运用:游戏AI入门及AI优化指南

    前言: 现如今,所有电子游戏都离不开AI的运用,对于游戏策划而言AI是什么,AI又是如何运作,可以说是面试时的加分项,本文在这里不探讨理论的AI(采用深度强化学习的智能AI,如腾讯AI Lab.网易伏 ...

  8. 深度强化学习落地方法论(8)——新书推荐《深度强化学习落地指南》

    知乎原文链接 文章目录 记一次成功的Exploration DRL落地中的"武德"问题 本书的创作理念 关于强化学习 结语 大家好,已经很久没有更新这个专栏了,希望当初关注它的知友 ...

  9. 深度强化学习落地指南:弥合DRL算法原理和落地实践之间的断层 | 文末送书

    魏宁 著 电子工业出版社-博文视点 2021-08-01 ISBN: 9787121416446 定价: 109.00 元 新书推荐 ????今日福利 |关于本书| 本书从工业界一线算法工作者的视角, ...

最新文章

  1. NumPy学的还不错?来试试这20题
  2. 【刷算法】整数中1出现的次数(从1到n整数中1出现的次数)
  3. shiro之AuthenticationStrategy
  4. Palindrome Linked List
  5. 清理localstorage_vue 界面刷新数据被清除 localStorage的使用详解
  6. Reids 批量删除有相同前缀的keys
  7. 《jQuery Mobile入门经典》—— 2.2 展现CSS样式
  8. 两个年月下拉列表html,html年月日下拉联动菜单 年月日三下拉框联动
  9. python在直方图上画折线图_Python 中 plt 画柱状图和折线图
  10. Vue解决跨域问题之Node反向代理
  11. 面试经历---YY欢聚时代
  12. SWT定位– setBounds()或setLocation()
  13. java peek函数_java (String) s.peek()是什么意思?
  14. Android加载3D模型的学习笔记
  15. S3C2440 开发板实战(3):编译概念 + LED点亮闪烁
  16. switch语句用法
  17. nextcloud应用_4个Nextcloud必备编写应用程序
  18. 一文读懂如何用python调用matlab函数(windows环境)
  19. 说说PSTN、ISDN、 ADSL三种互联网接入方式的区别。
  20. Jmter的接口测试提升篇

热门文章

  1. 计算机毕业设计JAVA的影视资讯管理系统mybatis+源码+调试部署+系统+数据库+lw
  2. 用PE系统中虚拟光驱进行MSDN XP系统安装
  3. jQuery Mobile 过渡效果
  4. python中item是什么意思中文-Python中使用item()方法遍历字典的例子
  5. 暴利项目创业, 是未来最赚钱的行业, 很多人根本看不见
  6. 扫地机器人湿地_石头扫地机器人体验:拖地更方便更好了,能给爸妈买吗?| 验货...
  7. php查询获取经纬度的详细信息-腾讯地图
  8. 【Go】超详细Go入门
  9. vue 防止页面后退
  10. matlab中的repmat函数