我们在越来越多的领域都能遇到“机器学习”、“深度学习”以及 “人工智能”等术语。但它们到底是什么意思?具体可以应用在哪里?我们又为什么需要?

名词解释

深度学习是机器学习的子领域,而机器学习是人工智能的子领域。

(一)人工智能(AI)

AI通常是指由机器(一般是计算机程序)通过模仿或复制人类行为而构造出来的体系结构。“AI”这个术语涵盖多个子领域,例如专家系统、模式分析系统或机器人。基于AI的系统会利用不同的方法来对人类行为和决策结构进行模仿或建模,有关的方法包括统计算法、启发式程序、人工神经网络(ANN)或其他机器学习衍生技术。

(二)机器学习

机器学习是AI的子领域,它由一系列自动程序组成,可以从一组示例数据推演出基本规则,即通过示例数据来“习得”规则。通过应用预定义和可理解的算法和规则,或者使用人工神经网络(如深度学习)就可以实现此技术。机器学习技术可细分为“监督式学习”和“非监督式学习”。在监督式学习中,学习的样本数据同时包含输入数据和相应的预期结果(例如分类),而在非监督式学习中,应该由系统来自行确定输入数据可能产生的结果。

(三)深度学习

深度学习是一种机器学习方法,它作为人工神经网络可以根据学习过程中的示例数据来独立地构建(训练)出基本规则。尤其是在机器视觉领域,神经网络通常采用监督式学习的方法来训练,即通过示例数据和示例数据的预定义结果来进行训练。

二、深度学习的发展历程

(一)Turing Testing

图灵测试是人工智能是否真正能够成功的一个标准,“计算机科学之父”、“人工智能之父”英国数学家图灵在1950年的论文《机器会思考吗》中提出了图灵测试的概念。即把一个人和一台计算机分别放在两个隔离的房间中,房间外的一个人同时询问人和计算机相同的问题,如果房间外的人无法分别哪个是人,哪个是计算机,就能够说明计算机具有人工智能。

(二)医学上的发现

1981年的诺贝尔将颁发给了David Hubel和Torsten Wiesel,以及Roger Sperry。他们发现了人的视觉系统处理信息是分级的。

从视网膜(Retina)出发,经过低级的V1区提取边缘特征,到V2区的基本形状或目标的局部,再到高层的整个目标(如判定为一张人脸),以及到更高层的PFC(前额叶皮层)进行分类判断等。也就是说高层的特征是低层特征的组合,从低层到高层的特征表达越来越抽象和概念化,也即越来越能表现语义或者意图。

边缘特征 —–> 基本形状和目标的局部特征——>整个目标 这个过程其实和我们的常识是相吻合的,因为复杂的图形,往往就是由一些基本结构组合而成的。同时我们还可以看出:大脑是一个深度架构,认知过程也是深度的。

人脑神经元示意图

计算机识别图像的过程

(三)Deep Learning的出现

深度学习,恰恰就是通过组合低层特征形成更加抽象的高层特征(或属性类别)。例如,在计算机视觉领域,深度学习算法从原始图像去学习得到一个低层次表达,例如边缘检测器、小波滤波器等,然后在这些低层次表达的基础上,通过线性或者非线性组合,来获得一个高层次的表达。此外,不仅图像存在这个规律,声音也是类似的。比如,研究人员从某个声音库中通过算法自动发现了20种基本的声音结构,其余的声音都可以由这20种基本结构来合成!

三、深度学习的工作原理

(一)人工神经网络

深度学习使用了某种形式的人工神经网络(ANN)技术,因此必须先用示例数据进行训练。经过训练的ANN就可以用来执行相关任务。使用已经过训练的ANN的过程被称为“推理”。在推理时,ANN会根据习得的规则对所提供的数据进行评估。例如,可以评估输入的图像中的物体是否存在缺陷。

(二)神经元、层和连接

ANN由多个互相连接的“神经元”层组成。以最简单的情况为例,这些层具体是指输入层和输出层。可以将众多的神经元和连接看作一个矩阵。连接矩阵中包含输入矩阵的每个值,并连接到结果矩阵的值。连接矩阵的值包含了相应连接的权重。借助逻辑矩阵值以及输入值权重,可以在结果矩阵中生成相应的值。

(三)深度人工神经网络

“深度学习”指的是对深度ANN进行的训练。除了输入层和输出层外,在深度ANN的可见层之间还存在成百上千个用于输入和输出的“隐藏层”。每个隐藏层的结果矩阵即是下一层的输入矩阵。因此,只由最后一层的输出矩阵来提供结果。

(四)训练

训练ANN时,最初的焦点是随机设置的,然后逐步添加示例数据。要根据输入数据和预期结果并使用训练规则来调整关系权重。ANN的最终表现(即结果评估的精度)在很大程度上取决于训练时所用的示例数据。如果用于训练的内容有大量可变性高的示例数据,则通常能产生更精确的推理结果。如果使用大量非常相似或重复的数据进行训练,那么在遇到与示例数据不同的数据时,ANN就会无法对字段进行估算。这种情况叫做ANN的过拟合(Overfitting)。

四、深度学习可以做到哪些功能?

(一)图像分类

在图像分类应用中要将图像分配为不同的类别,例如区分有缺陷的组件与无缺陷组件,并根据不同类型的缺陷对图像进行排序,或者可用于将度假照片分配到不同的类别。在曲奇饼干的生产中,图像分类技术将检查所有饼干是否完好无损。

(二)图像分割和物体识别

图像分割可以将图像的每个像素分配给某个类别。这样就能识别出图像上的多个不同物体,例如可以识别购物篮中的不同水果,或识别交通系统中的路标、道路和的人员。此外,我们借助图像分割技术还能查看生产线上形状各异的曲奇饼干——圆形、方形或六边形。

(三)图像处理

深度学习技术还可用于处理和优化图像数据,例如,它能消除图像的干扰噪声或补偿光学透镜造成的干扰。

五、为什么需要深度学习?

如果有更多的数据,那么最好的选择就是使用性能更好的深度网络来处理。很多时候,使用的数据越多,结果就越准确。经典的ML方法需要一组复杂的ML算法,而更多的数据只会影响其精度,需要使用复杂的方法来弥补较低准确性的缺陷。此外,学习也受到影响——当添加更多的训练数据来训练模型时,学习几乎在某个时间点停止。所示的图形描述了深度学习算法与传统的机器学习算法的性能差异。

深度学习算法与经典的机器学习算法的性能比较

本文转载于公众号:BFT机器人

更多资讯请关注该公众号

什么是深度学习?我们为何需要深度学习?相关推荐

  1. 强化学习(八) - 深度Q学习(Deep Q-learning, DQL,DQN)原理及相关实例

    深度Q学习原理及相关实例 8. 深度Q学习 8.1 经验回放 8.2 目标网络 8.3 相关算法 8.4 训练算法 8.5 深度Q学习实例 8.5.1 主程序 程序注释 8.5.2 DQN模型构建程序 ...

  2. 深度学习 免费课程_深入学习深度学习,提供15项免费在线课程

    深度学习 免费课程 by David Venturi 大卫·文图里(David Venturi) 深入学习深度学习,提供15项免费在线课程 (Dive into Deep Learning with ...

  3. 大夏书系·学习共同体:走向深度学习

    作者:陈静静 著 出版社:华东师范大学出版社 品牌:华东师范大学出版社 出版时间:2020-06-01 大夏书系·学习共同体:走向深度学习 ISBN:9787576001969

  4. 深度学习经典教程:深度学习+动手学深度学习

    作者:[美] Ian,Goodfellow(伊恩·古德费洛),[加] Yoshua,Bengio(约书亚·本吉奥)等 出版社:人民邮电出版社 品牌:异步图书 出版时间:2019-06-01 深度学习经 ...

  5. 深度学习之单目深度估计:无监督学习篇

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:桔子毛 https://zhuanlan.zhihu.com/p/29968267 本文仅做学术 ...

  6. 从神经元到神经网络、从神经网络到深度学习:神经网络、深度学习、神经元、神经元模型、感知机、感知机困境、深度网络

    从神经元到神经网络.从神经网络到深度学习:神经网络.深度学习.神经元.神经元模型.感知机.感知机困境.深度网络 目录 从神经元到神经网络.从神经网络到深度学习 神经网络:

  7. 深度学习不得不会的迁移学习Transfer Learning

    http://blog.itpub.net/29829936/viewspace-2641919/ 2019-04-18 10:04:53 目录 一.概述 二.什么是迁移学习? 2.1 模型的训练与预 ...

  8. Bengio、Hinton的不懈追求——深度学习算法揭示大脑如何学习

    来源:AI科技评论 编译:Don 校对:青暮 "如果我们能够揭示大脑的某些学习机制或学习方法,那么人工智能将能迎来进一步的发展,"Bengio如是说. 深度学习依赖于精妙设计的算法 ...

  9. 【深度学习】新的深度学习优化器探索(协同优化)

    [深度学习]新的深度学习优化器探索(协同优化) 文章目录 1 RAdam VS Adam 2 自适应优化 3 LookAhead3.1 "侵入式"优化器3.2 LookAhead ...

  10. 【深度学习】详解集成学习的投票和Stacking机制

    [深度学习]详解集成学习的投票和Stacking机制 文章目录 1 基础原理1.1 硬投票1.2 软投票 2 pytorch综合多个弱分类器,投票机制,进行手写数字分类(boosting) 3 Sta ...

最新文章

  1. 图像混合模式:Android Paint Xfermode 使用和demo
  2. 2.1 name_scope 简单入门(一)
  3. Windows编程之定时器的使用和定时销毁桌面出现的窗口,以及窗口句柄的获取
  4. 当你在浏览器输入一个网址,如http://www.taobao.com,按回车之后发生了什么?请从技术的角度描述,如浏览器、网络(UDP、TCP、HTTP等),以及服务器等各种参与对象上由此引发的一系
  5. Zend Framework学习之Zend_Mail
  6. java铃声类_java多线程抓取铃声多多官网的铃声数据
  7. 大学学计算机专业好吗,现在上大学学计算机专业好吗?好找工作吗?听他人说计算机学不了什么?学的人也多,...
  8. 无网络访问权限怎么办_老司机教你IPV4无网络访问权限怎么办
  9. Could NOT find OpenSSL, try to set the path to OpenSSL root folder in the system variable
  10. 关于“时间序列回归”,这些你必须知道的事!
  11. 555定时器的应用——施密特触发器
  12. Iocomp.Ultra Pack V5.SP3 for .Net Crack
  13. 汤家凤:历年真题怎么用?接力题典怎么配合?黄金十月拼命干,提高很多分数不是梦!...
  14. 深入Java内存区域与OOM
  15. python处理grd格式文件_python sklearn中,GBDT模型训练之后,可以查看模型中树的分裂路径吗?...
  16. Java开发erp系统,高级面试题+解析
  17. 取得当前日期相对应的月初,月末,季初,季末,年初,年末
  18. Python|随机数的奥秘
  19. 关于工作和生活的点滴心得
  20. 一篇文章搞定DX9.0c 环境里的3DXSpriet !!

热门文章

  1. js:字符串(string)转json
  2. python给列表的N个元素赋值-*表达式
  3. 电脑计算机界面打开后无法缩小,技术编辑演示win10系统iE网页界面大小无法缩放的办法...
  4. 【移动开发】View的scrollTo()和scrollBy()区别
  5. iframe嵌入网页时,页面大小怎么自适应
  6. 删除MySQL中字段中括号以及括号之内的内容
  7. 哪款文件比较软件适合程序员
  8. linux网卡 命令 ncmil,Linux常用性能检测命令解释
  9. github上提交pr的完整流程
  10. 信号完整性分析5——信号上升时间