机器之心报道

机器之心编辑部

由于太受欢迎,这本书先后出版了英文、中文简体和中文繁体三个版本。其覆盖内容的范围之广令帝国理工学院教授、香港浸会大学副校长郭毅可印象深刻。如今,这本书的中文简体版正式开放下载。

得益于 DeepMind AlphaGo 和 OpenAI Five 成功的案例,深度强化学习受到大量的关注,相关技术广泛应用于不同的领域。但是,对于一名学习者来说,市面上很少有书籍或者教程能同时覆盖从「0 到 1」和「从 1 到 N」的深度强化学习内容,学习材料非常零散。

为了克服这一难题,北京大学前沿计算研究中心助理教授董豪博士等编写了一本名为《Deep Reinforcement Learning: Foundamentals, Research and Applications》的英文书籍。该书于 2020 年 6 月由 Springer 发行,纸质版和电子版销售量都很大,电子版本下载量已经超过了 8 万册。

由于反响比较热烈,作者团队建立了读者交流群,很多读者都表示希望能有中文(简体)版本,还有港台地区的同学反映希望能有繁体字版本。因此,他们就把书翻译成了中文简体和繁体,并于 2021 年 6 月和 2022 年 1 月发行。其中,中文简体第一版一经发行已售罄,现已发行第二版。

为什么这本书如此受欢迎?我们先来看一下它的内容。

整本书共分为三个部分,覆盖了学习深度强化学习所需的所有内容。

第一部分(基础部分)介绍了强化学习的基础知识、常用的深度强化学习算法及其实现方法:

第二部分对精选的深度强化学习研究方向展开介绍,这对希望开展相关研究的读者非常有意义。

为了帮助读者更加深入地理解深度强化学习细节并把相关技术应用到实际中,第三部分仔细地讲述了大量应用的实现细节,例如机器人学习跑步、机械臂控制、下围棋、多智能体平台等等,并提供相关的开源代码。

可以看到,无论你是计算机科学专业背景、希望从零开始学习深度强化学习并开展研究课题和实践项目的学生,还是没有很强的机器学习背景、但是希望快速学习深度强化学习并将其应用到具体产品中的软件工程师,这本书都能帮到你。

帝国理工学院教授、数据科学研究所创始所长、香港浸会大学副校长郭毅可就表示对这本书覆盖内容的范围之广印象深刻,他认为,「这种风格的书籍是对初学者和科研人员绝佳的学习材料。」他还表示,「拥抱开源社区是深度学习得到快速发展不可或缺的一个原因。我很欣慰这本书提供了大量的开源代码。」

北京大学博雅特聘教授、前沿计算研究中心执行主任陈宝权也认为,「这本书提供了可靠的深度强化学习内容介绍,缩小基础理论和实践之间的差距,以提供详细的描述和算法实现为特色,提供大量技巧和速查表。」

当然,这么优秀的书籍离不开一个强大的编撰团队。该书作者团队全部为一线科研人员和开源社区成员,使用深度强化学习解决不同领域的问题。其中,董豪、丁子涵、仉尚航还是编者团队的成员。

《深度强化学习:基础、研究与应用》的作者团队。

董豪是北京大学计算机学院、前沿计算研究中心助理教授,博士生导师。于 2019 年秋获得英国帝国理工学院博士学位。研究方向主要涉及计算机视觉和机器人,目的是降低学习智能系统所需要的数据,实现自主学习。他致力于推广人工智能技术,是深度学习开源框架 TensorLayer 的创始人,并获得 ACM MM 2017 年度最佳开源软件奖。他在英国帝国理工和英国中央兰开夏大学获得一等研究生和一等本科学位。

丁子涵是普林斯顿大学博士。于 2019 年获得英国帝国理工学院硕士学位,曾在加拿大 Borealis AI、腾讯 Robotics X 实验室有过工作经历。本科就读中国科学技术大学,获物理和计算机双学位。研究方向主要涉及强化学习、机器人控制、计算机视觉等。在 ICRA, IROS, NeurIPS, AAAI, IJCAI, Physical Review 等顶级期刊与会议发表多篇论文,是 TensorLayer-RLzoo、TensorLet 和 Arena 等开源代码库的贡献者。

仉尚航是北京大学计算机学院助理教授,博士生导师。于 2018 年博士毕业于美国卡内基梅隆大学,后于 2020 年加入加州大学伯克利分校 BAIR 实验室任博士后研究员。研究方向主要为开放环境泛化机器学习理论与系统,同时在计算机视觉和强化学习方向拥有丰富研究经验。在人工智能顶级期刊和会议上发表论文 30 余篇,并申请 5 项美中专利。获 AAAI'21 最佳论文奖,美国 2018 年度 “EECS Rising Star”,Adobe 学术合作基金,Qualcomm 创新奖提名等。

团队的多样性使得该书风格对不同领域的读者更为友好,并对代码库进行支持和维护。

在谈及该书的写作历程时,该团队表示,「写这本书的工作量是巨大的,作者们的工作和学习都很忙,都是兼职写这本书,而且还有好几个配套的代码库,能够按计划完成已经挺不容易了。因此,我们探索并采用了开源的模式来写作,不过前后也花费了一年多的时间。」

目前,该团队已经开放了该书中文简体版本的下载权限,感兴趣的读者请戳:https://deepreinforcementlearningbook.org/

——The  End——

写的书太受欢迎怎么办?北大《深度强化学习》作者:那就开放下载吧相关推荐

  1. 写的书太受欢迎怎么办?北大《深度强化学习》重磅开放下载

    来源:机器之心 由于太受欢迎,这本书先后出版了英文.中文简体和中文繁体三个版本.其覆盖内容的范围之广令帝国理工学院教授.香港浸会大学副校长郭毅可印象深刻.如今,这本书的中文简体版正式开放下载. 得益于 ...

  2. 深度强化学习落地指南:弥合DRL算法原理和落地实践之间的断层 | 文末送书

    魏宁 著 电子工业出版社-博文视点 2021-08-01 ISBN: 9787121416446 定价: 109.00 元 新书推荐 ????今日福利 |关于本书| 本书从工业界一线算法工作者的视角, ...

  3. BENDR for BCI : 多伦多大学研究者提出受BERT启发的深度神经网络学习​海量EEG 数据...

    从预测文本到智能语音控制,人机交互近年来得到了快速的发展.许多科学家设想下一个前沿领域是脑机接口(BCI),直接的神经连接,利用脑电图(EEG)信号捕捉到的脑电活动. 为了开发能够更好地利用公开的大量 ...

  4. 计算机位置隐私保护的书,移动群智感知中基于深度强化学习的位置隐私保护策略...

    [摘要] 群智感知服务的广泛应用带来了个人隐私的泄漏,然而现存的隐私保护策略不能适应群智感知环境.针对相关缺陷,提出了一种移动群智感知中基于深度强化学习的隐私保护策略.该策略通过泛化任务,使得攻击者无 ...

  5. 1.5万字详述 | 全开源:python写小游戏+AI强化学习与传统DFS/BFS控制分别实现

    简介:本周的强化学习我们来到实践部分.我以我在 GitHub 上开源的项目 PiperLiu / Amazing-Brick-DFS-and-DRL 为对象,从零开始与各位朋友分享:如何用 pytho ...

  6. 哪本python入门书内容最详细-重磅 | 由浅入深的 AI 学习路线,最详细的资源整理!...

    原标题:重磅 | 由浅入深的 AI 学习路线,最详细的资源整理! [导读] 本文由知名开源平台,AI技术平台以及领域专家: Datawhale, ApacheCN, AI有道和 黄海广博士联合整理贡献 ...

  7. 邹伟博士出书啦!——《强化学习》从基础概念、核心原理到应用案例(文末赠书)...

    强化学习日渐流行,作为当今社会最热门的研究课题之一,其关注度正与日俱增.强化学习是机器学习的一个分支,通过与环境的交互进行学习,目前广泛应用于游戏领域,如ATARI游戏.西洋双陆棋.AlphaZero ...

  8. 《Easy RL:强化学习教程》出版了!文末送书

    作为人工智能里最受关注的领域之一,强化学习的热度一直居高不下,但它的学习难度也同样不低. 在学习强化学习的过程中,遇到了有无数资料却难以入门的问题,于是发起了Datawhale强化学习项目,希望自学的 ...

  9. 一周上榜新书:强化学习、深度学习最受程序员关注

    4月出版了很多新书,上周有两本书最受程序员关注,<动手学强化学习>和<PyTorch深度学习实战>位于一周榜单TOP10.现在和小编一起来看看有哪些新书上榜. 1.动手学强化学 ...

最新文章

  1. python输出多行对齐_如何用python3输出print对齐?
  2. C#一键显示及杀死占用端口号进程
  3. 身体器官工作表一览,别熬夜
  4. 微信支付8·8无现金日超1亿人次、近70万家门店参与
  5. qt2-无边框窗口创建、拖拽、阴影
  6. 《淘宝网开店 拍摄 修图 设计 装修 实战150招》一一2.11 动感十足的S形构图
  7. 256qam调制星座图_科普:5G是怎么调制的?
  8. 进程间通信 - 整理
  9. mongodb空间查询java,java查看mongodb集合表空间大小
  10. 时间序列分析工具箱——tidyquant
  11. python少儿编程教案_超好玩的Python少儿编程
  12. 去泰国,怎能错过这些零食!
  13. 如何在 Bios 中更改硬盘模式?
  14. C语言--[Error] stray '\237' in program--解决方案。
  15. python陆股通_【科普】沪股通、深股通、港股通、陆股通都是什么意思?
  16. html/css 钢琴黑白格布局
  17. Python基础语法——if选择
  18. 软件工程-第五章-总体设计
  19. Postgresql中的large object
  20. ValueError: module functions cannot set METH_CLASS or METH_STATIC 的快速处理方法

热门文章

  1. 贪心之最大相容子集合问题
  2. 计算机体系结构的一知半解
  3. 运维(1) Jenkinsfile+Dockerfile+Nginx实现前端Vue自动化部署
  4. 【IPFS应用开发】--zabbix监控接口配置
  5. python作排产计划表_生产排程计划表
  6. 03 CoCos Creator 偏好设置中ndk配置
  7. 计算机无法识别平板电脑,平板电脑连接电脑没反应怎么办【图解】
  8. android平板能玩吃鸡吗,吃鸡不卡的安卓平板
  9. 计算机组成原理实验主存储器,计算机组成原理实验课件--存储器.ppt
  10. 【阅读】《法治的细节》笔记整理