来源:机器之心

由于太受欢迎,这本书先后出版了英文、中文简体和中文繁体三个版本。其覆盖内容的范围之广令帝国理工学院教授、香港浸会大学副校长郭毅可印象深刻。如今,这本书的中文简体版正式开放下载。

得益于 DeepMind AlphaGo 和 OpenAI Five 成功的案例,深度强化学习受到大量的关注,相关技术广泛应用于不同的领域。但是,对于一名学习者来说,市面上很少有书籍或者教程能同时覆盖从「0 到 1」和「从 1 到 N」的深度强化学习内容,学习材料非常零散。

为了克服这一难题,北京大学前沿计算研究中心助理教授董豪博士等编写了一本名为《Deep Reinforcement Learning: Foundamentals, Research and Applications》的英文书籍。该书于 2020 年 6 月由 Springer 发行,纸质版和电子版销售量都很大,电子版本下载量已经超过了 8 万册。

由于反响比较热烈,作者团队建立了读者交流群,很多读者都表示希望能有中文(简体)版本,还有港台地区的同学反映希望能有繁体字版本。因此,他们就把书翻译成了中文简体和繁体,并于 2021 年 6 月和 2022 年 1 月发行。其中,中文简体第一版一经发行已售罄,现已发行第二版。

书籍开放下载:

1. 点击下面链接进入公众号:“深度学习技术前沿

2. 在公众号消息对话框回复:北大强化学习” 即可以获取哈~

为什么这本书如此受欢迎?我们先来看一下它的内容。

整本书共分为三个部分,覆盖了学习深度强化学习所需的所有内容。

第一部分(基础部分)介绍了强化学习的基础知识、常用的深度强化学习算法及其实现方法:

第二部分对精选的深度强化学习研究方向展开介绍,这对希望开展相关研究的读者非常有意义。

为了帮助读者更加深入地理解深度强化学习细节并把相关技术应用到实际中,第三部分仔细地讲述了大量应用的实现细节,例如机器人学习跑步、机械臂控制、下围棋、多智能体平台等等,并提供相关的开源代码。

可以看到,无论你是计算机科学专业背景、希望从零开始学习深度强化学习并开展研究课题和实践项目的学生,还是没有很强的机器学习背景、但是希望快速学习深度强化学习并将其应用到具体产品中的软件工程师,这本书都能帮到你。

帝国理工学院教授、数据科学研究所创始所长、香港浸会大学副校长郭毅可就表示对这本书覆盖内容的范围之广印象深刻,他认为,「这种风格的书籍是对初学者和科研人员绝佳的学习材料。」他还表示,「拥抱开源社区是深度学习得到快速发展不可或缺的一个原因。我很欣慰这本书提供了大量的开源代码。」

北京大学博雅特聘教授、前沿计算研究中心执行主任陈宝权也认为,「这本书提供了可靠的深度强化学习内容介绍,缩小基础理论和实践之间的差距,以提供详细的描述和算法实现为特色,提供大量技巧和速查表。」

当然,这么优秀的书籍离不开一个强大的编撰团队。该书作者团队全部为一线科研人员和开源社区成员,使用深度强化学习解决不同领域的问题。其中,董豪、丁子涵、仉尚航还是编者团队的成员。

《深度强化学习:基础、研究与应用》的作者团队。

董豪是北京大学计算机学院、前沿计算研究中心助理教授,博士生导师。于 2019 年秋获得英国帝国理工学院博士学位。研究方向主要涉及计算机视觉和机器人,目的是降低学习智能系统所需要的数据,实现自主学习。他致力于推广人工智能技术,是深度学习开源框架 TensorLayer 的创始人,并获得 ACM MM 2017 年度最佳开源软件奖。他在英国帝国理工和英国中央兰开夏大学获得一等研究生和一等本科学位。

丁子涵是普林斯顿大学博士。于 2019 年获得英国帝国理工学院硕士学位,曾在加拿大 Borealis AI、腾讯 Robotics X 实验室有过工作经历。本科就读中国科学技术大学,获物理和计算机双学位。研究方向主要涉及强化学习、机器人控制、计算机视觉等。在 ICRA, IROS, NeurIPS, AAAI, IJCAI, Physical Review 等顶级期刊与会议发表多篇论文,是 TensorLayer-RLzoo、TensorLet 和 Arena 等开源代码库的贡献者。

仉尚航是北京大学计算机学院助理教授,博士生导师。于 2018 年博士毕业于美国卡内基梅隆大学,后于 2020 年加入加州大学伯克利分校 BAIR 实验室任博士后研究员。研究方向主要为开放环境泛化机器学习理论与系统,同时在计算机视觉和强化学习方向拥有丰富研究经验。在人工智能顶级期刊和会议上发表论文 30 余篇,并申请 5 项美中专利。获 AAAI'21 最佳论文奖,美国 2018 年度 “EECS Rising Star”,Adobe 学术合作基金,Qualcomm 创新奖提名等。

团队的多样性使得该书风格对不同领域的读者更为友好,并对代码库进行支持和维护。

在谈及该书的写作历程时,该团队表示,「写这本书的工作量是巨大的,作者们的工作和学习都很忙,都是兼职写这本书,而且还有好几个配套的代码库,能够按计划完成已经挺不容易了。因此,我们探索并采用了开源的模式来写作,不过前后也花费了一年多的时间。」

书籍开放下载:

1. 点击下面链接进入公众号:“深度学习技术前沿

2. 在公众号消息对话框回复:北大强化学习” 即可以获取哈~

写的书太受欢迎怎么办?北大《深度强化学习》重磅开放下载相关推荐

  1. 写的书太受欢迎怎么办?北大《深度强化学习》作者:那就开放下载吧

    机器之心报道 机器之心编辑部 由于太受欢迎,这本书先后出版了英文.中文简体和中文繁体三个版本.其覆盖内容的范围之广令帝国理工学院教授.香港浸会大学副校长郭毅可印象深刻.如今,这本书的中文简体版正式开放 ...

  2. 深度强化学习落地指南:弥合DRL算法原理和落地实践之间的断层 | 文末送书

    魏宁 著 电子工业出版社-博文视点 2021-08-01 ISBN: 9787121416446 定价: 109.00 元 新书推荐 ????今日福利 |关于本书| 本书从工业界一线算法工作者的视角, ...

  3. BENDR for BCI : 多伦多大学研究者提出受BERT启发的深度神经网络学习​海量EEG 数据...

    从预测文本到智能语音控制,人机交互近年来得到了快速的发展.许多科学家设想下一个前沿领域是脑机接口(BCI),直接的神经连接,利用脑电图(EEG)信号捕捉到的脑电活动. 为了开发能够更好地利用公开的大量 ...

  4. 太牛逼了!阿里技术团队重磅开放 《Java 开发手册》(附下载地址)!

    <阿里巴巴 Java 开发手册>的愿景是码出高效,码出质量.它结合作者的开发经验和架构历程,提炼阿里巴巴集团技术团队的集体编程经验和软件设计智慧,浓缩成为立体的编程规范和最佳实践. 从严格 ...

  5. 计算机位置隐私保护的书,移动群智感知中基于深度强化学习的位置隐私保护策略...

    [摘要] 群智感知服务的广泛应用带来了个人隐私的泄漏,然而现存的隐私保护策略不能适应群智感知环境.针对相关缺陷,提出了一种移动群智感知中基于深度强化学习的隐私保护策略.该策略通过泛化任务,使得攻击者无 ...

  6. 1.5万字详述 | 全开源:python写小游戏+AI强化学习与传统DFS/BFS控制分别实现

    简介:本周的强化学习我们来到实践部分.我以我在 GitHub 上开源的项目 PiperLiu / Amazing-Brick-DFS-and-DRL 为对象,从零开始与各位朋友分享:如何用 pytho ...

  7. 邹伟博士出书啦!——《强化学习》从基础概念、核心原理到应用案例(文末赠书)...

    强化学习日渐流行,作为当今社会最热门的研究课题之一,其关注度正与日俱增.强化学习是机器学习的一个分支,通过与环境的交互进行学习,目前广泛应用于游戏领域,如ATARI游戏.西洋双陆棋.AlphaZero ...

  8. 《Easy RL:强化学习教程》出版了!文末送书

    作为人工智能里最受关注的领域之一,强化学习的热度一直居高不下,但它的学习难度也同样不低. 在学习强化学习的过程中,遇到了有无数资料却难以入门的问题,于是发起了Datawhale强化学习项目,希望自学的 ...

  9. 一周上榜新书:强化学习、深度学习最受程序员关注

    4月出版了很多新书,上周有两本书最受程序员关注,<动手学强化学习>和<PyTorch深度学习实战>位于一周榜单TOP10.现在和小编一起来看看有哪些新书上榜. 1.动手学强化学 ...

最新文章

  1. 在SpringBoot中使用SpringDataRedis
  2. PostgreSQL — 数据库实例只读锁定
  3. undefined 和null的区别?
  4. mysql 表的timestamp为自动添加
  5. 转工厂方法模式-想吃什么汉堡自己要
  6. BackTrack5 安装中文输入法
  7. 分公司部署加速设备实现广域网加速
  8. spring-test测试demo
  9. 算法时间复杂度分析专题一(帮助快速解题)
  10. php截取字符串utf8,php自定义截取中文字符串-utf8版
  11. 马丁关于id加密验证防攻击
  12. Oracle1518,redhat 5.4 Oracle 10g r2
  13. Servlet(10)—请求转发和请求重定向
  14. 软件测试的重要性与必要性,软件测试的目的和意义
  15. DNS协议及Bind应用
  16. 厦门大学计算机考研复试线2021,【厦门大学】2021考研复试分数线3月13日已公布!速看!...
  17. RETINA 屏幕1px 边框实现
  18. 如果你对未来还有点迷茫不妨来看一下,必看的软件测试指引!!!
  19. 使用计算机时按什么键打开,计算机进入BIOS的快捷键是什么|打开计算机以进入BIOS设置时按下的键...
  20. 字符串转换成UTF8编码

热门文章

  1. iosandroidjavaee
  2. nginx 缓存动态内容 和使用自定义错误503
  3. Source Insight 经典教程
  4. 局域网伪造源地址DDoS***解决方法
  5. 我对虚拟化的认识(一)
  6. python客户价值分析_Python数据分析与应用航空公司客户价值分析.ppt
  7. 15个应该掌握的jupyter notebook技巧
  8. synchronized 与 Reentrant均为可重入锁 区别后者比前者增加了长时等待可中断 设置是否公平锁 绑定多个条件
  9. 《预训练周刊》第8期:首个千亿中文大模型「盘古」问世、谷歌等提出视频音频文本转换器VATT...
  10. LIVE 预告 | CVPR 2021 预讲 · 悉尼科技大学ReLER实验室专场