市面上关于深度学习的书籍很多,本书最大的特点是理论结合实战和内容的广度。现在大家能够看到的深度学习书籍大概可以分为两类,一类只关注理论而另一类只关注应用。前者多为一些会议论文集,当然也包括 Ian Goodfellow 和 Yoshua Bengio 等人的 Deep Learning。这类书籍的读者是专业的研究者和相关专业的学生,它更多的是关注基础理论和最新的前沿进展。这类书籍通常比较难懂,而且读完之后仍然不知道怎么动手解决问题。

而另外一类书籍更关注应用,多为框架工具的介绍,偶尔提及一些理论也是点到而止,在读者看来各种算法只是一个黑盒子,虽然能跑起来,但是知其然不知其所以然,不知道怎么调优,碰到问题时更加不知道怎么解决。

本书的目标是使用通俗易懂的语言来介绍基础理论和最新的进展,同时也介绍代码的实现。通过理论与实践的结合使读者更加深入的理解理论知识,同时也把理论知识用于指导实践。因此本书的一大特点就是每介绍完一个模型都会介绍它的实现,读者阅读完一个模型的介绍之后就可以运行、阅读和修改一下这些代码,从而可以更加深刻的理解理论知识。

本书第二个比较大的特点就是内容的广度,本书覆盖听觉、视觉、语言和强化学习四大领域。从章节的命名读者也可以看到作者的”野心”,本书覆盖了深度学习的大部分常见应用方向。市面上的书大部分只介绍视觉和语言的内容,而且一般也只限于 CNN 用于简单的图像分类或者 RNN、seq2seq 模型在 NLP 中的应用。

本书的视觉部分除了介绍 CNN 以及最新的 ResNet 和 Inception 模型之外,还介绍了用于目标检测的 R-CNN、Fast R-CNN、Faster R-CNN 模型;用于实例分割的 Mask R-CNN 模型;用于人脸识别的 FaceNet;还包括 Neural Style Transfer 和 GAN(包括 DCGAN 和 Cycle GAN)。

语言部分除了很多书都有的 RNN/LSTM/GRU 等基础模型,用于机器翻译、chatbot 的 seq2seq 模型和 Attention 机制之外还包括最新的 ELMo、OpenAI GPT 和 BERT 等模型,此外本书还介绍了 NLP 的很多经典任务,包括语言模型、词性标注、成分句法分析、依存句法分析和机器翻译。除了介绍深度学习的解决方案之外也会介绍传统的基于统计机器学习的方法,让读者能够了解这个领域的发展过程。

而听觉和强化学习是目前市面上大部分书都很少提及的内容。大家都知道 2012 年 AlexNet 在视觉领域的突破,但是深度学习最早的突破其实发生在语音识别方向。本书会详细介绍经典的基于 HMM-GMM 的语音识别系统,包括基于 WFST 的解码器和 Kaldi 的用法。接着会介绍 HMM-DNN 系统,然后到最新的 End-to-End 的语音识别系统,主要会介绍 CTC 模型,包括 CTC 用于验证码识别的示例和 DeepSpeech 系统。最后会介绍使用 CNN 实现简单的语音关键词识别,这个简单的例子在智能设备上会非常有用。

国内关于强化学习的书籍不多,因此本书首先用一章的篇幅介绍强化学习的基本概念,包括 MDP、动态规划、蒙特卡罗方法、TD 学习和 Policy Gradient。接着会介绍 DQN、基于深度学习的 Policy Gradient 算法,最后是介绍 AlphaGo、AlphaGo Zero 和 Alpha Zero 算法。

由于涉及的内容很广,再加上作者比较啰嗦的写作方式,所以几年下来写的内容竟然上千页。出版社的编辑说书太厚这没法出版。因此把这本书拆分成了两本:《深度学习理论与实战:基础篇》《深度学习理论与实战:提高篇》。提高篇免费开放,供大家参考,希望对大家的工作有所帮助。如果读者在阅读提高篇有一些困难,那么建议读者可以上网(https://item.jd.com/12543405.html)购买基础篇,先学习需要的基础知识。

《深度学习理论与实战:基础篇》共包含 8 章,每章的主要内容如下:

第 1 章介绍人工智能的发展历程和机器学习的基本概念,使用通俗的语言介绍机器学习任务的分类、常见模型、损失函数和衡量指标,最后通过一个简单的线性回归示例来加深对这些概念的理解。

第 2 章介绍全连接神经网络的基本概念和反向传播算法的详细推导过程,不使用框架完全自己实现一个多层的神经网络来识别 MNIST 的手写数字。接下来介绍基本的优化技巧,包括激活函数的选择、参数的初始化、Dropout、BatchNormalization 和 Adam等学习率自适应算法。

第 3 章介绍卷积神经网络,使用卷积神经网络来解决 MNIST 和 CIFAR-10数据集的识别问题,通过 CIFAR-10 的例子介绍怎么在 TensorFlow 里使用多 GPU 训练,最后介绍残差神经网络。

第 4 章介绍循环神经网络,使用它来实现姓名分类及生成莎士比亚风格的句子,接着会介绍 Seq2Seq 模型和注意力机制,使用它们来实现英语—法语、汉语—英语的机器翻译功能。

第 5 章介绍生成对抗网络,介绍对抗训练的基本原理和 DCGAN 模型,最后使用  DCGAN 来实现人脸照片的生成。

第 6 章介绍 TensorFlow,首先介绍基本概念、优化器和数据输入输出等,然后介绍全连接神经网络和卷积神经网络等常见网络结构。因为 RNN 的复杂性,我们单独使用一节来详细介绍怎么在 TensorFlow 使用 RNN、LSTM 和 GRU。接着介绍高层的 Estimator API 和 TensorBoard,以及怎么调试 TensorFlow 代码。最后介绍模型的保存和 TensorFlowServing。

第 7 章介绍 PyTorch,通过使用不同的方法来实现三层的神经网络来重点介绍 Autograd,包括数据的加载和处理,最后是一个迁移学习的示例。

第 8 章介绍 Keras,包括卷积神经网络、残差神经网络和循环神经网络在 Keras 里的用法,最后通过简短的代码示例来演示怎么实现文本图片的分类、图片问答和视频问答。

《深度学习理论与实战:基础篇》配套的源代码网站为:

https://github.com/fancyerii/deep_learning_theory_and_practice

里面包含全部可以运行的代码,如果大家发现代码有问题也欢迎在这里提交 issue。

看到那么多干货内容

是不是迫不及待想要一睹为快?

小编这就为你奉上家赠书福利!

转发本文到朋友圈

将截图发送至公众号后台

并在文末留言区说出

你对这本新书有哪些期待

我们将随机抽取 5 位读者

送出这本干货满满的新书

留言截止时间:7 月 24 日 12:00

?

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 一键购书

赠书福利 | 首本理论和实战结合的深度学习书籍相关推荐

  1. 国内首本免费深度学习书籍!还有人没Get么?

    这本书的作者很有趣鸭. 一开篇别的不说,先跟大家讲哲学,讨论人工智能实现的可能性.摘录一些他的结论: 人工智能可以实现 自由意志并不存在 量子力学并不能证明自由意志的存在 幸福感和物质水平提高并没有绝 ...

  2. 实战:基于深度学习的道路损坏检测

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 1.简介 道路基础设施是一项重要的公共资产,因为它有助于经济发展和 ...

  3. 开发实战:基于深度学习+maven+SSM+EasyUI的高校共享汽车管理系统(一)

    基于深度学习+maven+SSM+EasyUI的高校共享汽车管理系统 1.项目简介 在现在,共享汽车在中国各地方开始热起来,于是本人想做一个基于maven+SSM+EasyUI的高校共享汽车管理系统, ...

  4. 深度学习课程大纲_赠书 | 哈工大研究生课程的高分讲义,深度学习的the book

    "要不要在算法中预置一些先天知识,就像人类一样?" 纽约大学知名的神经科学教授 Gary Marcus 向深度学习界大佬 Yann LeCun 发出提问.换句话说,Gary Mar ...

  5. 【深度学习实战】从零开始深度学习(五):生成对抗网络——深度学习中的非监督学习问题

    参考资料: <PyTorch深度学习>(人民邮电出版社)第7章 生成网络 PyTorch官方文档 廖星宇著<深度学习入门之Pytorch>第6章 生成对抗网络 其他参考的网络资 ...

  6. 实战:从深度学习探究计算机视觉

    随着计算机视觉迅猛发展,以及大量地应用,迫使企业亟需大量AI算法的高端人才.为了培养高级CV算法工程师.AI应用人才,解决企业用人需求与求职者的就业鸿沟,开课吧教研团队倾心研发出,构建AI人才培养的计 ...

  7. 最应该看的一本人工智能理论的书-神经网络于深度学习-目录

    看重点是理论书 如果想要学习实战的请忽略 这本书是我读过的 神经网络于深度学习理论讲的最全的 先展示一下目录 可以通过以下链接购买纸质版本 https://p.pinduoduo.com/Tge9D6 ...

  8. 实战:基于深度学习和几何的3D边界框估计

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 3D 对象检测问题在需要决策或与现实世界中的对象交互的机器人应用中 ...

  9. 2018AI人工智能基础实战python机器深度学习算法视频教程

    人工智能(Artificial Intelligence),英文缩写为AI.它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的一门新的技术科学. 6 M3 T7 T9 K$ Q6 ...

最新文章

  1. 135.137.138.139.445端口分析
  2. [WUSTCTF2020]level3
  3. 数据结构与算法之选择排序图文详解及代码 (C++实现)
  4. 连接堡垒机出现java环境_Java 8:长期支持的堡垒
  5. MacOS中Elasticsearch的安装「借助Homebrew」
  6. python自动计算多个教学班的优秀率_第二个月课堂009python之总结(002)
  7. 栈实现队列(队列实现栈)
  8. Android开发笔记(八十七)几个修饰关键字
  9. 用户名_网络安全与防御-OpenSSH用户名枚举及其检测方法
  10. 解决Appium-windows安装时无法自动下载Appium-Desktop
  11. 安卓手机使用Tasker实现应用级功能,屏幕翻译v9,翻译复制贴图
  12. 零售超市pos收银系统多少钱一台
  13. 一根网线实现双机互联共享文件
  14. 第一次修U盘,没想到...
  15. SkeyeVSS实现RTSP、Onvif监控摄像头网页无插件化直播监控解决方案
  16. 微信播放在服务器视频无法播放音乐,【bug解决】ios微信浏览器中背景音乐无法播放...
  17. 数据结构 严薇敏 顺序表的实现(增 删 改)及其使用方法详解
  18. 拉格朗日乘数法求可能极值
  19. java 关于Scanner类中hasNextXxx()方法
  20. html中鱼眼效果,视频鱼眼效果制作 视频鱼眼效果制作方法

热门文章

  1. 19 Error handling and Go go语言错误处理
  2. LINQ-from多from
  3. String All Methods
  4. QEMU 1.3 发布,模拟处理器
  5. SqlServer 0和空字符串''等价?-----类型的隐式转换问题
  6. 对将‘47 ’转化为int格式错误的问题解决
  7. DotNetNuke与MemberShip的结合(五年版) 三步汇总
  8. java 处理byte_java - 文件到Java中的byte [] - 堆栈内存溢出
  9. python编程绘图库turtle如何安装_Python绘图库Turtle详细分析
  10. python qt designer 重定向_Python+PyQt5+QtDesigner+PyUic+PyRcc环境安装与配置