什么是深度学习？我们为何需要深度学习？

我们在越来越多的领域都能遇到“机器学习”、“深度学习”以及 “人工智能”等术语。但它们到底是什么意思？具体可以应用在哪里？我们又为什么需要？

名词解释

深度学习是机器学习的子领域，而机器学习是人工智能的子领域。

（一）人工智能（AI）

AI通常是指由机器（一般是计算机程序）通过模仿或复制人类行为而构造出来的体系结构。“AI”这个术语涵盖多个子领域，例如专家系统、模式分析系统或机器人。基于AI的系统会利用不同的方法来对人类行为和决策结构进行模仿或建模，有关的方法包括统计算法、启发式程序、人工神经网络(ANN)或其他机器学习衍生技术。

（二）机器学习

机器学习是AI的子领域，它由一系列自动程序组成，可以从一组示例数据推演出基本规则，即通过示例数据来“习得”规则。通过应用预定义和可理解的算法和规则，或者使用人工神经网络（如深度学习）就可以实现此技术。机器学习技术可细分为“监督式学习”和“非监督式学习”。在监督式学习中，学习的样本数据同时包含输入数据和相应的预期结果（例如分类），而在非监督式学习中，应该由系统来自行确定输入数据可能产生的结果。

（三）深度学习

深度学习是一种机器学习方法，它作为人工神经网络可以根据学习过程中的示例数据来独立地构建（训练）出基本规则。尤其是在机器视觉领域，神经网络通常采用监督式学习的方法来训练，即通过示例数据和示例数据的预定义结果来进行训练。

二、深度学习的发展历程

（一）Turing Testing

图灵测试是人工智能是否真正能够成功的一个标准，“计算机科学之父”、“人工智能之父”英国数学家图灵在1950年的论文《机器会思考吗》中提出了图灵测试的概念。即把一个人和一台计算机分别放在两个隔离的房间中，房间外的一个人同时询问人和计算机相同的问题，如果房间外的人无法分别哪个是人，哪个是计算机，就能够说明计算机具有人工智能。

（二）医学上的发现

1981年的诺贝尔将颁发给了David Hubel和Torsten Wiesel，以及Roger Sperry。他们发现了人的视觉系统处理信息是分级的。

从视网膜（Retina）出发，经过低级的V1区提取边缘特征，到V2区的基本形状或目标的局部，再到高层的整个目标（如判定为一张人脸），以及到更高层的PFC（前额叶皮层）进行分类判断等。也就是说高层的特征是低层特征的组合，从低层到高层的特征表达越来越抽象和概念化，也即越来越能表现语义或者意图。

边缘特征 —–> 基本形状和目标的局部特征——>整个目标这个过程其实和我们的常识是相吻合的，因为复杂的图形，往往就是由一些基本结构组合而成的。同时我们还可以看出：大脑是一个深度架构，认知过程也是深度的。

人脑神经元示意图

计算机识别图像的过程

（三）Deep Learning的出现

深度学习，恰恰就是通过组合低层特征形成更加抽象的高层特征（或属性类别）。例如，在计算机视觉领域，深度学习算法从原始图像去学习得到一个低层次表达，例如边缘检测器、小波滤波器等，然后在这些低层次表达的基础上，通过线性或者非线性组合，来获得一个高层次的表达。此外，不仅图像存在这个规律，声音也是类似的。比如，研究人员从某个声音库中通过算法自动发现了20种基本的声音结构，其余的声音都可以由这20种基本结构来合成！

三、深度学习的工作原理

（一）人工神经网络

深度学习使用了某种形式的人工神经网络(ANN)技术，因此必须先用示例数据进行训练。经过训练的ANN就可以用来执行相关任务。使用已经过训练的ANN的过程被称为“推理”。在推理时，ANN会根据习得的规则对所提供的数据进行评估。例如，可以评估输入的图像中的物体是否存在缺陷。

（二）神经元、层和连接

ANN由多个互相连接的“神经元”层组成。以最简单的情况为例，这些层具体是指输入层和输出层。可以将众多的神经元和连接看作一个矩阵。连接矩阵中包含输入矩阵的每个值，并连接到结果矩阵的值。连接矩阵的值包含了相应连接的权重。借助逻辑矩阵值以及输入值权重，可以在结果矩阵中生成相应的值。

（三）深度人工神经网络

“深度学习”指的是对深度ANN进行的训练。除了输入层和输出层外，在深度ANN的可见层之间还存在成百上千个用于输入和输出的“隐藏层”。每个隐藏层的结果矩阵即是下一层的输入矩阵。因此，只由最后一层的输出矩阵来提供结果。

（四）训练

训练ANN时，最初的焦点是随机设置的，然后逐步添加示例数据。要根据输入数据和预期结果并使用训练规则来调整关系权重。ANN的最终表现（即结果评估的精度）在很大程度上取决于训练时所用的示例数据。如果用于训练的内容有大量可变性高的示例数据，则通常能产生更精确的推理结果。如果使用大量非常相似或重复的数据进行训练，那么在遇到与示例数据不同的数据时，ANN就会无法对字段进行估算。这种情况叫做ANN的过拟合(Overfitting)。

四、深度学习可以做到哪些功能？

（一）图像分类

在图像分类应用中要将图像分配为不同的类别，例如区分有缺陷的组件与无缺陷组件，并根据不同类型的缺陷对图像进行排序，或者可用于将度假照片分配到不同的类别。在曲奇饼干的生产中，图像分类技术将检查所有饼干是否完好无损。

（二）图像分割和物体识别

图像分割可以将图像的每个像素分配给某个类别。这样就能识别出图像上的多个不同物体，例如可以识别购物篮中的不同水果，或识别交通系统中的路标、道路和的人员。此外，我们借助图像分割技术还能查看生产线上形状各异的曲奇饼干——圆形、方形或六边形。

（三）图像处理

深度学习技术还可用于处理和优化图像数据，例如，它能消除图像的干扰噪声或补偿光学透镜造成的干扰。

五、为什么需要深度学习？

如果有更多的数据，那么最好的选择就是使用性能更好的深度网络来处理。很多时候，使用的数据越多，结果就越准确。经典的ML方法需要一组复杂的ML算法，而更多的数据只会影响其精度，需要使用复杂的方法来弥补较低准确性的缺陷。此外，学习也受到影响——当添加更多的训练数据来训练模型时，学习几乎在某个时间点停止。所示的图形描述了深度学习算法与传统的机器学习算法的性能差异。

深度学习算法与经典的机器学习算法的性能比较

本文转载于公众号：BFT机器人

更多资讯请关注该公众号

什么是深度学习？我们为何需要深度学习？相关推荐

强化学习（八） - 深度Q学习(Deep Q-learning, DQL,DQN)原理及相关实例
深度Q学习原理及相关实例 8. 深度Q学习 8.1 经验回放 8.2 目标网络 8.3 相关算法 8.4 训练算法 8.5 深度Q学习实例 8.5.1 主程序程序注释 8.5.2 DQN模型构建程序 ...
深度学习免费课程_深入学习深度学习，提供15项免费在线课程
深度学习免费课程 by David Venturi 大卫·文图里(David Venturi) 深入学习深度学习,提供15项免费在线课程 (Dive into Deep Learning with ...
大夏书系·学习共同体：走向深度学习
作者:陈静静著出版社:华东师范大学出版社品牌:华东师范大学出版社出版时间:2020-06-01 大夏书系·学习共同体:走向深度学习 ISBN:9787576001969
深度学习经典教程：深度学习+动手学深度学习
作者:[美] Ian,Goodfellow(伊恩·古德费洛),[加] Yoshua,Bengio(约书亚·本吉奥)等出版社:人民邮电出版社品牌:异步图书出版时间:2019-06-01 深度学习经 ...
深度学习之单目深度估计：无监督学习篇
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达作者:桔子毛 https://zhuanlan.zhihu.com/p/29968267 本文仅做学术 ...
从神经元到神经网络、从神经网络到深度学习：神经网络、深度学习、神经元、神经元模型、感知机、感知机困境、深度网络
从神经元到神经网络.从神经网络到深度学习:神经网络.深度学习.神经元.神经元模型.感知机.感知机困境.深度网络目录从神经元到神经网络.从神经网络到深度学习神经网络:
深度学习不得不会的迁移学习Transfer Learning
http://blog.itpub.net/29829936/viewspace-2641919/ 2019-04-18 10:04:53 目录一.概述二.什么是迁移学习? 2.1 模型的训练与预 ...
Bengio、Hinton的不懈追求——深度学习算法揭示大脑如何学习
来源:AI科技评论编译:Don 校对:青暮 "如果我们能够揭示大脑的某些学习机制或学习方法,那么人工智能将能迎来进一步的发展,"Bengio如是说. 深度学习依赖于精妙设计的算法 ...
【深度学习】新的深度学习优化器探索（协同优化）
[深度学习]新的深度学习优化器探索(协同优化) 文章目录 1 RAdam VS Adam 2 自适应优化 3 LookAhead3.1 "侵入式"优化器3.2 LookAhead ...
【深度学习】详解集成学习的投票和Stacking机制
[深度学习]详解集成学习的投票和Stacking机制文章目录 1 基础原理1.1 硬投票1.2 软投票 2 pytorch综合多个弱分类器,投票机制,进行手写数字分类(boosting) 3 Sta ...

什么是深度学习？我们为何需要深度学习？

什么是深度学习？我们为何需要深度学习？相关推荐

最新文章

热门文章