什么是深度学习?我们为何需要深度学习?
我们在越来越多的领域都能遇到“机器学习”、“深度学习”以及 “人工智能”等术语。但它们到底是什么意思?具体可以应用在哪里?我们又为什么需要?
名词解释
深度学习是机器学习的子领域,而机器学习是人工智能的子领域。
(一)人工智能(AI)
AI通常是指由机器(一般是计算机程序)通过模仿或复制人类行为而构造出来的体系结构。“AI”这个术语涵盖多个子领域,例如专家系统、模式分析系统或机器人。基于AI的系统会利用不同的方法来对人类行为和决策结构进行模仿或建模,有关的方法包括统计算法、启发式程序、人工神经网络(ANN)或其他机器学习衍生技术。
(二)机器学习
机器学习是AI的子领域,它由一系列自动程序组成,可以从一组示例数据推演出基本规则,即通过示例数据来“习得”规则。通过应用预定义和可理解的算法和规则,或者使用人工神经网络(如深度学习)就可以实现此技术。机器学习技术可细分为“监督式学习”和“非监督式学习”。在监督式学习中,学习的样本数据同时包含输入数据和相应的预期结果(例如分类),而在非监督式学习中,应该由系统来自行确定输入数据可能产生的结果。
(三)深度学习
深度学习是一种机器学习方法,它作为人工神经网络可以根据学习过程中的示例数据来独立地构建(训练)出基本规则。尤其是在机器视觉领域,神经网络通常采用监督式学习的方法来训练,即通过示例数据和示例数据的预定义结果来进行训练。
二、深度学习的发展历程
(一)Turing Testing
图灵测试是人工智能是否真正能够成功的一个标准,“计算机科学之父”、“人工智能之父”英国数学家图灵在1950年的论文《机器会思考吗》中提出了图灵测试的概念。即把一个人和一台计算机分别放在两个隔离的房间中,房间外的一个人同时询问人和计算机相同的问题,如果房间外的人无法分别哪个是人,哪个是计算机,就能够说明计算机具有人工智能。
(二)医学上的发现
1981年的诺贝尔将颁发给了David Hubel和Torsten Wiesel,以及Roger Sperry。他们发现了人的视觉系统处理信息是分级的。
从视网膜(Retina)出发,经过低级的V1区提取边缘特征,到V2区的基本形状或目标的局部,再到高层的整个目标(如判定为一张人脸),以及到更高层的PFC(前额叶皮层)进行分类判断等。也就是说高层的特征是低层特征的组合,从低层到高层的特征表达越来越抽象和概念化,也即越来越能表现语义或者意图。
边缘特征 —–> 基本形状和目标的局部特征——>整个目标 这个过程其实和我们的常识是相吻合的,因为复杂的图形,往往就是由一些基本结构组合而成的。同时我们还可以看出:大脑是一个深度架构,认知过程也是深度的。
人脑神经元示意图
计算机识别图像的过程
(三)Deep Learning的出现
深度学习,恰恰就是通过组合低层特征形成更加抽象的高层特征(或属性类别)。例如,在计算机视觉领域,深度学习算法从原始图像去学习得到一个低层次表达,例如边缘检测器、小波滤波器等,然后在这些低层次表达的基础上,通过线性或者非线性组合,来获得一个高层次的表达。此外,不仅图像存在这个规律,声音也是类似的。比如,研究人员从某个声音库中通过算法自动发现了20种基本的声音结构,其余的声音都可以由这20种基本结构来合成!
三、深度学习的工作原理
(一)人工神经网络
深度学习使用了某种形式的人工神经网络(ANN)技术,因此必须先用示例数据进行训练。经过训练的ANN就可以用来执行相关任务。使用已经过训练的ANN的过程被称为“推理”。在推理时,ANN会根据习得的规则对所提供的数据进行评估。例如,可以评估输入的图像中的物体是否存在缺陷。
(二)神经元、层和连接
ANN由多个互相连接的“神经元”层组成。以最简单的情况为例,这些层具体是指输入层和输出层。可以将众多的神经元和连接看作一个矩阵。连接矩阵中包含输入矩阵的每个值,并连接到结果矩阵的值。连接矩阵的值包含了相应连接的权重。借助逻辑矩阵值以及输入值权重,可以在结果矩阵中生成相应的值。
(三)深度人工神经网络
“深度学习”指的是对深度ANN进行的训练。除了输入层和输出层外,在深度ANN的可见层之间还存在成百上千个用于输入和输出的“隐藏层”。每个隐藏层的结果矩阵即是下一层的输入矩阵。因此,只由最后一层的输出矩阵来提供结果。
(四)训练
训练ANN时,最初的焦点是随机设置的,然后逐步添加示例数据。要根据输入数据和预期结果并使用训练规则来调整关系权重。ANN的最终表现(即结果评估的精度)在很大程度上取决于训练时所用的示例数据。如果用于训练的内容有大量可变性高的示例数据,则通常能产生更精确的推理结果。如果使用大量非常相似或重复的数据进行训练,那么在遇到与示例数据不同的数据时,ANN就会无法对字段进行估算。这种情况叫做ANN的过拟合(Overfitting)。
四、深度学习可以做到哪些功能?
(一)图像分类
在图像分类应用中要将图像分配为不同的类别,例如区分有缺陷的组件与无缺陷组件,并根据不同类型的缺陷对图像进行排序,或者可用于将度假照片分配到不同的类别。在曲奇饼干的生产中,图像分类技术将检查所有饼干是否完好无损。
(二)图像分割和物体识别
图像分割可以将图像的每个像素分配给某个类别。这样就能识别出图像上的多个不同物体,例如可以识别购物篮中的不同水果,或识别交通系统中的路标、道路和的人员。此外,我们借助图像分割技术还能查看生产线上形状各异的曲奇饼干——圆形、方形或六边形。
(三)图像处理
深度学习技术还可用于处理和优化图像数据,例如,它能消除图像的干扰噪声或补偿光学透镜造成的干扰。
五、为什么需要深度学习?
如果有更多的数据,那么最好的选择就是使用性能更好的深度网络来处理。很多时候,使用的数据越多,结果就越准确。经典的ML方法需要一组复杂的ML算法,而更多的数据只会影响其精度,需要使用复杂的方法来弥补较低准确性的缺陷。此外,学习也受到影响——当添加更多的训练数据来训练模型时,学习几乎在某个时间点停止。所示的图形描述了深度学习算法与传统的机器学习算法的性能差异。
深度学习算法与经典的机器学习算法的性能比较
本文转载于公众号:BFT机器人
更多资讯请关注该公众号
什么是深度学习?我们为何需要深度学习?相关推荐
- 强化学习(八) - 深度Q学习(Deep Q-learning, DQL,DQN)原理及相关实例
深度Q学习原理及相关实例 8. 深度Q学习 8.1 经验回放 8.2 目标网络 8.3 相关算法 8.4 训练算法 8.5 深度Q学习实例 8.5.1 主程序 程序注释 8.5.2 DQN模型构建程序 ...
- 深度学习 免费课程_深入学习深度学习,提供15项免费在线课程
深度学习 免费课程 by David Venturi 大卫·文图里(David Venturi) 深入学习深度学习,提供15项免费在线课程 (Dive into Deep Learning with ...
- 大夏书系·学习共同体:走向深度学习
作者:陈静静 著 出版社:华东师范大学出版社 品牌:华东师范大学出版社 出版时间:2020-06-01 大夏书系·学习共同体:走向深度学习 ISBN:9787576001969
- 深度学习经典教程:深度学习+动手学深度学习
作者:[美] Ian,Goodfellow(伊恩·古德费洛),[加] Yoshua,Bengio(约书亚·本吉奥)等 出版社:人民邮电出版社 品牌:异步图书 出版时间:2019-06-01 深度学习经 ...
- 深度学习之单目深度估计:无监督学习篇
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:桔子毛 https://zhuanlan.zhihu.com/p/29968267 本文仅做学术 ...
- 从神经元到神经网络、从神经网络到深度学习:神经网络、深度学习、神经元、神经元模型、感知机、感知机困境、深度网络
从神经元到神经网络.从神经网络到深度学习:神经网络.深度学习.神经元.神经元模型.感知机.感知机困境.深度网络 目录 从神经元到神经网络.从神经网络到深度学习 神经网络:
- 深度学习不得不会的迁移学习Transfer Learning
http://blog.itpub.net/29829936/viewspace-2641919/ 2019-04-18 10:04:53 目录 一.概述 二.什么是迁移学习? 2.1 模型的训练与预 ...
- Bengio、Hinton的不懈追求——深度学习算法揭示大脑如何学习
来源:AI科技评论 编译:Don 校对:青暮 "如果我们能够揭示大脑的某些学习机制或学习方法,那么人工智能将能迎来进一步的发展,"Bengio如是说. 深度学习依赖于精妙设计的算法 ...
- 【深度学习】新的深度学习优化器探索(协同优化)
[深度学习]新的深度学习优化器探索(协同优化) 文章目录 1 RAdam VS Adam 2 自适应优化 3 LookAhead3.1 "侵入式"优化器3.2 LookAhead ...
- 【深度学习】详解集成学习的投票和Stacking机制
[深度学习]详解集成学习的投票和Stacking机制 文章目录 1 基础原理1.1 硬投票1.2 软投票 2 pytorch综合多个弱分类器,投票机制,进行手写数字分类(boosting) 3 Sta ...
最新文章
- 图像混合模式:Android Paint Xfermode 使用和demo
- 2.1 name_scope 简单入门(一)
- Windows编程之定时器的使用和定时销毁桌面出现的窗口,以及窗口句柄的获取
- 当你在浏览器输入一个网址,如http://www.taobao.com,按回车之后发生了什么?请从技术的角度描述,如浏览器、网络(UDP、TCP、HTTP等),以及服务器等各种参与对象上由此引发的一系
- Zend Framework学习之Zend_Mail
- java铃声类_java多线程抓取铃声多多官网的铃声数据
- 大学学计算机专业好吗,现在上大学学计算机专业好吗?好找工作吗?听他人说计算机学不了什么?学的人也多,...
- 无网络访问权限怎么办_老司机教你IPV4无网络访问权限怎么办
- Could NOT find OpenSSL, try to set the path to OpenSSL root folder in the system variable
- 关于“时间序列回归”,这些你必须知道的事!
- 555定时器的应用——施密特触发器
- Iocomp.Ultra Pack V5.SP3 for .Net Crack
- 汤家凤:历年真题怎么用?接力题典怎么配合?黄金十月拼命干,提高很多分数不是梦!...
- 深入Java内存区域与OOM
- python处理grd格式文件_python sklearn中,GBDT模型训练之后,可以查看模型中树的分裂路径吗?...
- Java开发erp系统,高级面试题+解析
- 取得当前日期相对应的月初,月末,季初,季末,年初,年末
- Python|随机数的奥秘
- 关于工作和生活的点滴心得
- 一篇文章搞定DX9.0c 环境里的3DXSpriet !!
热门文章
- js:字符串(string)转json
- python给列表的N个元素赋值-*表达式
- 电脑计算机界面打开后无法缩小,技术编辑演示win10系统iE网页界面大小无法缩放的办法...
- 【移动开发】View的scrollTo()和scrollBy()区别
- iframe嵌入网页时,页面大小怎么自适应
- 删除MySQL中字段中括号以及括号之内的内容
- 哪款文件比较软件适合程序员
- linux网卡 命令 ncmil,Linux常用性能检测命令解释
- github上提交pr的完整流程
- 信号完整性分析5——信号上升时间