如今,深度强化学习算法被认为是最有可能实现通用人工智能计算的方法。

由于深度强化学习算法融合了深度学习、统计、信息学、运筹学、概率论、优化等多个学科的内容,入门门槛高是事实。

虽然博文菌推荐过很多优秀的AI著作,但自己学起强化学习算法仍然是一团浆糊。看一眼读过无数遍的马尔可夫决策过程,像极了当年单词书上的 abandon 。叹口气,又瞅了瞅镜子中那张不太聪明的脸,陷入了沉思。

作为一个科技小编,其实我清楚我的问题出在哪里(不是脑子)。

就像学游泳,只学理论而不下水,永远学不会。

只懂原理而不进行编程训练,那永远也别想学会强化学习算法!

淦!道理说的头头是道,可如何动手,去哪动手?

问题就在这里。市面上大部分强化学习著作的重心用在了描述算法原理上,至于算法的实现,讲得并不多。所以才让很多像博文菌这样的新手,在一页页的苦读后仍然很难入门。

不要把强化学习当作仇敌,除了死磕,一定存在更温柔的学习方法!

温柔的方法它来了!

今天介绍的这本书是2017年横空出世的《深入浅出强化学习:原理入门》的姊妹篇 ——

《深入浅出强化学习:编程实战》

这是一本以编程为主题的书!本书的写作初衷就是:

通过编程实例帮助那些想要学习强化学习算法的同学更深入、更清楚地理解算法!

在学习过程中,我们可以根据书中的代码进行动手编程,并修改程序中的超参数,然后根据运行结果不断体会算法原理。慢慢会发现,过去一直纠结的难点在动手之后竟然迎刃而解了!

它的到来就是为了破解我们无法上手实践的困境!

四大维度完善你的技能水平

实战性强 以编程实战为主线,旨在帮助读者通过实战更清晰地理解算法并快速应用。

系统全面 在马尔可夫理论框架下,介绍了最基本的算法,涵盖了基于值函数的算法,直接策略搜索方法,基于模型的强化学习方法等。

前沿技术分析 剖析了AlphaZero强大技术背后的深度强化学习原理,并介绍了它在五子棋上的具体实现。

操作性强 读者可根据书中的代码直接上手,并通过修改程序中的超参数,亲自体会算法原理。

三位专家联手出击

本书由 郭宪、宋俊潇、方勇纯三位老师精心打造

郭宪,南开大学人工智能学院讲师,2016年1月获得工学博士学位,并到南开大学从事博士后研究工作,2018年7月任教于南开大学至今。

宋俊潇,香港科技大学博士,目前就职于启元世界,担任研究科学家,专注于决策智能相关算法的研究与开发。

方勇纯,南开大学人工智能学院院长、教授、博士生导师,国家杰出青年基金获得者(2013年),教育部长江学者特聘教授(2017年)。

清晰结构助力击碎入门障碍

本书首先介绍马尔可夫决策过程的理论框架,然后介绍基于动态规划的策略迭代算法和值迭代算法,在此基础上分3 篇介绍了目前强化学习算法中最基本的算法:

【第 1 篇】基于值函数的强化学习算法,介绍了基于两种策略评估方法的强化学习算法,以及如何将函数逼近的方法引入强化学习算法中。

【第 2 篇】直接策略搜索方法,介绍了基本的策略梯度方法、AC 方法、PPO 方法和DDPG 算法。

【第 3 篇】基于模型的强化学习方法,介绍了基于MPC 的方法、AlphaZero 算法基本原理及在五子棋上的具体实现细节。


更多科技资讯请见微信公众号:博文视点Broadview(微信号:bvbooks)

带你动手编程的强化学习著作,每行代码都是它的温柔!相关推荐

  1. RL强化学习算法90行代码快速实战 DQN代码分层讲解

    强化学习DQN算法介绍: DeepMind<Playing Atari with Deep Reinforcement Learning>提出了DQN ,DQN使用卷积神经网络作为价值函数 ...

  2. 【零基础强化学习】100行代码教你训练——基于SARSA的CliffWalking爬悬崖游戏

    基于SARSA的CliffWalking爬悬崖游戏

  3. 百度飞桨7日营——世界冠军带你从零实践强化学习总结

    课程大纲 学习感悟 强化学习一直是我非常感兴趣的领域.为了了解强化学习的原理,我也曾看过伯克利大学的CS 294-112课程来了解相关的知识,但是一直没有找到合适的教程去实践体验一下.这也是7日营里科 ...

  4. 动手搭建深度强化学习的自动股票量化交易系统

    基于深度强化学习的股票量化交易 ⭐ ⭐ ⭐ 欢迎点个小小的Star支持!⭐ ⭐ ⭐ 开源不易,希望大家多多支持~ 更多实践案例(AI识虫,基于PaddleX实现森林火灾监测,眼疾识别,智能相册分类等) ...

  5. 独家 | 浅谈强化学习原理(附代码链接)

    作者:Michel Kana 翻译:王琦 校对:王雨桐 本文约4900字,建议阅读15分钟. 本文介绍了强化学习的基本原理,并通过代码实例来讲解如何找到最优策略. Google在2017年年底发布了A ...

  6. 花最少的钱,训超6的机器人:谷歌大脑推出机器人强化学习平台,硬件代码全开源...

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 想要在现实世界的机器人身上探索强化学习(RL),并非易事. 首先,你得拥有类似这样的机器人平台: 而像这样的一只PR2,售价高达40万美元( ...

  7. 计算未来轻沙龙 | 对抗攻击、强化学习,你关心的都在这里!

    Hi,大家好~ 临近期末,本学期的活动也迎来了最后一期 机器学习前沿研讨会 提到机器学习,你是否想起了 对抗攻击.强化学习.集成学习.表示学习 这么多细分的方向和领域? 想广泛涉猎却精力有限? 聆听大 ...

  8. 谷歌大脑推出机器人强化学习平台,硬件代码全开源,花最少的钱,训超6的机器人...

    点击我爱计算机视觉标星,更快获取CVML新技术 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 想要在现实世界的机器人身上探索强化学习(RL),并非易事. 首先,你得拥有类似这样的机器人平 ...

  9. 手把手教你入门深度强化学习(附链接代码)

    来源:机器之心 本文约2600字,建议阅读10分钟. GitHub 开源了一份深度强化学习的教程,总结了从 DQN 到彩虹模型的理论和代码实现. 深度强化学习在机器学习领域的热度一直很高.最近,Git ...

  10. 强化学习入门及其实现代码

    作者:chen_h 微信号 & QQ:862251340 微信公众号:coderpai 介绍 目前,对于全球科学家而言,"如何去学习一种新技能"成为了一个最基本的研究问题. ...

最新文章

  1. Java 汉子转拼音
  2. 通用型硬件只是个传说
  3. java 二进制,八进制,十进制,十六进制间相互转换的方法
  4. Logstash 父子关系 配置
  5. 如何处理高并发情况下的DB插入
  6. 认识 MySQL 和 Redis 的数据一致性问题
  7. clickhouse注入的利用
  8. jQuery插件编写基础之“又见弹窗”
  9. static在php中,php中static关键字在类中的使用
  10. React 16.8.3 发布,构建用户界面的 JavaScript 库
  11. 32/64位Win7_2017.09通用多合一安装版/Ghost版
  12. scipy安装_4. Python--Scipy库(下/13-17)
  13. 魔兽世界模型文件.m2 在D3D下的渲染
  14. oracle启动pmon,oracle 11g pmon工作内容系列三
  15. 坐标系投影转换CGCS2000坐标系(国家2000坐标系)等高线地形图
  16. 忆亚强建筑预算软件的2001年半年时光
  17. WPF开发之解决程序调用自定义dll库在部分win7电脑上无法运行的情况
  18. 如何用光盘映像文件重装服务器系统,光盘镜像文件怎么安装|教你安装光盘镜像方法...
  19. 医疗时鲜资讯:如何玩转医学影像中心?
  20. PC微信聊天记录数据迁移恢复

热门文章

  1. 总结51单片机避免复位触发的几种方法
  2. c#基础系列2---深入理解 String
  3. 12. Integer to Roman
  4. YUV420查表法高效、无失真的转换为RGB32格式
  5. 在eclipse中使用Github进行单元测试
  6. Linux--U盘安装Ubuntu12.04
  7. 初学Linux (Linux_note)
  8. 【最短路径】 SPFA算法优化
  9. 线上不修改mysql的存储引擎对emoji标签做删除处理(PHP)
  10. 洛谷P2886牛继电器