作者 | CraigStedman
编译 | CDA数据科学研究院

​深度学习是机器学习(ML)和人工智能(AI)的一种,它模仿人类获取某些类型的知识的方式。深度学习是数据科学的重要元素,其中包括统计和预测模型。对于负责收集,分析和解释大量数据的数据科学家而言,这是极为有益的。深度学习使此过程更快,更轻松。

​从最简单的角度讲,可以将深度学习视为自动化预测分析的一种方式。尽管传统的机器学习算法是线性的,但深度学习算法却以越来越复杂和抽象的层次结构堆叠在一起。

​要了解深度学习,请想象一个第一个单词是dog的小孩。幼儿通过指向物体并说出“ ”一词来了解狗是什么—不是。父母说:“是,那是狗”,或者:“否,那不是狗”。随着幼儿继续指向物体,他逐渐意识到所有狗所具有的特征。幼儿在不知情的情况下通过建立层次结构来阐明复杂的抽象概念(狗的概念),在层次结构中,每个抽象层次都是使用从层次结构的上一层获得的知识来创建的。

深度学习如何工作

​使用深度学习的计算机程序所经历的过程与蹒跚学步的学习来识别狗的过程几乎相同。层次结构中的每个算法都对其输入应用非线性变换,并使用其学习的知识来创建统计模型作为输出。迭代一直持续到输出达到可接受的精度水平为止。数据必须经过的处理层数是促使标签产生深刻影响的原因

​在传统的机器学习中,学习过程是受监督的,并且程序员在告诉计算机应寻找哪种类型的事物以决定图像包含狗还是不包含狗时,必须非常具体。这是一个费力的过程,称为*特征提取,*计算机的成功率完全取决于程序员为“狗”准确定义特征集的能力。深度学习的优势是程序无需监督即可自行构建功能集。无监督学习不仅更快,而且通常更准确。

​最初,计算机程序可能会提供训练数据-一组图像,人类已经为这些图像使用元标签将每个图像标记为“狗”或“非狗” 。该程序使用从训练数据中接收到的信息来创建“狗”的功能集并建立预测模型。在这种情况下,计算机首先创建的模型可能会预测图像中具有四只腿和一条尾巴的任何东西都应标记为“狗”。当然,该程序不知道标签“四腿”或“尾巴”。它将仅查找数字数据中的像素模式。每次迭代,预测模型都会变得更加复杂和准确。

​与需要花费数周甚至数月才能了解“狗”概念的幼儿不同,可以向使用深度学习算法的计算机程序显示一个训练集,并对数百万张图像进行分类,以准确识别其中包含狗的图像。

​为了达到可接受的精度水平,深度学习程序需要访问大量的培训数据和处理能力,在大数据和云计算时代之前,程序员都无法轻松获得这两种数据。因为深度学习编程可以直接从其自己的迭代输出中创建复杂的统计模型,所以它能够从大量未标记,未结构化的数据中创建准确的预测模型。这一点很重要,因为物联网(IoT)继续变得越来越普及,因为人类和机器创建的大多数数据都是非结构化的,并且没有标签。

什么是深度学习神经网络?

​一种高级的机器学习算法,称为人工神经网络,是大多数深度学习模型的基础。结果,深度学习有时可能被称为深度神经学习或深度神经网络。

​神经网络有几种不同的形式,包括递归神经网络,卷积神经网络,人工神经网络和前馈神经网络-每种都有针对特定用例的好处。但是,它们都以某种相似的方式发挥作用,通过输入数据并让模型自己确定模型是否对给定的数据元素做出了正确的解释或决策。

​神经网络涉及反复试验的过程,因此它们需要大量的数据进行训练。仅在大多数企业接受大数据分析并积累大量数据存储之后,神经网络才流行起来,这并非巧合。由于模型的前几次迭代涉及对图像或语音部分的内容进行过某种程度的猜测,因此必须标记训练阶段使用的数据,以便模型可以查看其猜测是否准确。这意味着,尽管许多使用大数据的企业拥有大量数据,但非结构化数据的帮助较小。非结构化数据只有经过训练并达到可接受的准确性水平,才能通过深度学习模型进行分析,但是深度学习模型无法对非结构化数据进行训练。

深度学习方法

​可以使用各种不同的方法来创建强大的深度学习模型。这些技术包括学习率衰减,迁移学习,从头开始和辍学训练。

​**学习率下降。**学习速率是一个超参数-一个在学习过程之前定义系统或为其系统设置条件的因素-每次更改模型权重时,该模型将控制模型对响应于估计误差的变化量。太高的学习率可能会导致训练过程不稳定或无法获得最佳的权重。太小的学习率可能会导致冗长的培训过程,从而有可能被卡住。

​学习速率衰减方法-也称为学习速率退火或自适应学习速率-是调整学习速率以提高性能并减少训练时间的过程。训练过程中最简单,最常见的学习率调整包括随时间降低学习率的技术。

​**转移学习。**这个过程涉及完善先前训练过的模型;它需要一个到现有网络内部接口。首先,用户向现有网络提供包含以前未知分类的新数据。一旦对网络进行了调整,就可以使用更具体的分类功能执行新任务。这种方法的优点是所需数据比其他方法少得多,从而将计算时间减少到数分钟或数小时。

​**从头开始训练。**此方法要求开发人员收集大标签的数据集并配置可以学习功能和模型的网络体系结构。该技术对于新应用程序以及具有大量输出类别的应用程序特别有用。但是,总的来说,这是一种不太常见的方法,因为它需要大量的数据,导致培训需要几天或几周的时间。

​**退出。**该方法试图通过在训练过程中从神经网络中随机删除单元及其连接来解决具有大量参数的网络的过拟合问题。已经证明,辍学方法可以提高神经网络在语音识别,文档分类和计算生物学等领域的监督学习任务上的性能。

深度学习应用示例

​由于深度学习模型以类似于人脑的方式处理信息,因此它们可以应用于人们执行的许多任务。目前,深度学习已用于大多数常见的图像识别工具,自然语言处理和语音识别软件中。这些工具开始在自动驾驶汽车和语言翻译服务等各种应用程序中出现。

深度学习有什么用?

​如今,深度学习的用例包括所有类型的大数据分析应用程序,尤其是那些侧重于自然语言处理,语言翻译,医学诊断,股市交易信号,网络安全和图像识别的应用程序。

当前正在使用深度学习的特定领域包括:

  • 客户体验。深度学习模型已经用于聊天机器人。并且,随着它的不断成熟,有望在各种业务中实施深度学习,以改善客户体验并提高客户满意度。
  • 文字生成。正在教机器文本的语法和样式,然后使用该模型自动创建与原始文本的正确拼写,语法和样式匹配的全新文本。
  • 航空航天和军事。深度学习被用于从卫星中检测物体,以识别出感兴趣的区域以及部队的安全区域或不安全区域。
  • 工业自动化。深度学习通过提供自动检测何时工人或物体离机器太近的服务来改善工厂和仓库等环境中的工人安全。
  • 添加颜色。可以使用深度学习模型将颜色添加到黑白照片和视频中。过去,这是一个非常耗时的手动过程。
  • 医学研究。癌症研究人员已开始在其实践中实施深度学习,以自动检测癌细胞。
  • 计算机视觉。深度学习极大地增强了计算机视觉,为计算机提供了极高的精度,可进行对象检测以及图像分类,恢复和分割。

局限与挑战

​深度学习模型的最大局限性在于它们通过观察来学习。这意味着他们只知道他们所训练的数据中包含的内容。如果用户的数据量很少或来自某个特定来源(不一定代表更广泛的功能区域),则模型将无法以可推广的方式学习。

​偏差问题也是深度学习模型的主要问题。如果模型训练包含偏差的数据,则该模型将在其预测中重现这些偏差。对于模型深度学习的程序员来说,这是一个令人头疼的问题,因为模型会根据数据元素的细微变化来学习区分。通常,程序员所确定的因素往往很重要。这意味着,例如,面部识别模型可能会基于种族或性别等事物来确定人的性格,而程序员不会意识到。

​学习率也可能成为深度学习模型的主要挑战。如果速率太高,则该模型将收敛太快,从而产生次优解决方案。如果速率太低,则该过程可能会卡住,甚至很难找到解决方案。

​深度学习模型的硬件要求也会造成限制。需要多核高性能图形处理单元(GPU)和其他类似的处理单元,以确保提高效率和减少时间消耗。但是,这些单元价格昂贵并且消耗大量能量。其他硬件要求包括随机存取存储器(RAM)和硬盘驱动器或基于RAM的固态驱动器(SSD)。

其他限制和挑战包括:

  • 深度学习需要大量数据。此外,功能更强大,更准确的模型将需要更多参数,进而需要更多数据。
  • 训练后,深度学习模型将变得僵化,无法处理多任务。他们可以提供有效且准确的解决方案,但只能解决一个特定问题。即使解决类似的问题,也需要重新培训系统。
  • 任何需要推理的应用程序(例如编程或应用科学方法)的长期规划和类似算法的数据处理,即使对于大数据,也完全超出了当前深度学习技术的能力范围。

深度学习与机器学习

​深度学习是机器学习的一个子集,它通过解决问题的方式与众不同。机器学习需要领域专家来识别大多数应用功能。另一方面,深度学习会逐步学习特征,从而消除了对领域专业知识的需求。这使得深度学习算法的训练时间比机器学习算法要长得多,机器学习算法只需要几秒钟到几小时。但是,在测试期间反之亦然。深度学习算法运行测试所需的时间比机器学习算法要少得多,后者的测试时间随数据量的增加而增加。

​此外,机器学习不需要像深度学习那样昂贵的高端机器和高性能GPU。

​最后,由于其卓越的可解释性或理解解决方案的能力,许多数据科学家选择传统的机器学习而非深度学习。当数据较小时,机器学习算法也是首选。

​深度学习变得更可取的情况包括:数据量大,特征自省或对诸如语音识别和自然语言处理之类的复杂问题缺乏领域理解的情况。

历史

​深度学习的历史可以追溯到1943年,当时Warren McCulloch和Walter Pitts使用数学和算法为神经网络创建了一个计算模型。但是,直到2000年代中期才出现“深度学习”一词。在Geoffrey Hinton和Ruslan Salakhutdinov发表论文之后,它得到了普及,该论文显示了如何一次训练多层神经网络。

​2012年,Google的算法揭示了识别猫的能力,从而在深度学习方面给人留下了深刻的印象。两年后的2014年,谷歌从英国收购了人工智能初创公司DeepMind。两年后,2016年,谷歌DeepMind的算法AlphaGo掌握了复杂的棋盘游戏Go,在汉城的一场比赛中击败了职业玩家Lee Sedol。

​最近,深度学习模型已在人工智能领域产生了大部分进步。深度强化学习已经成为一种将AI与复杂的应用程序集成的方法,例如机器人技术,视频游戏和自动驾驶汽车。深度学习与强化学习之间的主要区别在于,深度学习从训练集学习,然后将学到的知识应用于新的数据集,而深度强化学习则通过使用连续反馈调整动作来动态学习,以优化奖励。

​强化学习代理具有提供对生成对抗网络(GAN)的快速而强大的控制的能力。对抗阈值神经计算机(ATNC)将深度强化学习与GAN结合在一起,以设计具有特定的所需药理学性质的有机小分子。

​GAN还被用于生成用于机器学习任务的人工训练数据,可用于数据集不平衡的情况或数据包含敏感信息的情况。

一文带你深入了解,什么是深度学习及其工作原理相关推荐

  1. 这些人你还不认识?!一文带你有姿势地侃深度学习大佬

    大数据文摘作品 编译:余志文,笪洁琼,钱天培 近几年间,深度学习的兴起造就了一批超级巨星.一向在学术界默默无闻的大佬们,相继成为了业界的领头人,而他们的声名也再从业界一路传至大众耳中. 几个月前,An ...

  2. 干货丨一文带你玩转机器学习和深度学习

    俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据 ...

  3. 一文带你了解人脸检测算法的类型及其工作原理

    在过去的几年里,人脸识别受到了广泛的关注,被认为是图像分析领域最有前途的应用之一.人脸检测可以考虑人脸识别操作的很大一部分.根据其强度将计算资源集中在持有人脸的图像部分.图片中的人脸检测方法很复杂,因 ...

  4. TensorFlow贡献者黄文坚:解读对比13个深度学习框架后的选择

    [AI创新者]TensorFlow贡献者黄文坚:解读对比13个深度学习框架后的选择 AI创新者 Google 人工智能 深度学习 TensorFlow 阅读5774  [AI创新者]是CSDN人工智能 ...

  5. 综述 | 万字长文带你入门近几年深度学习的重要研究成果

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :机器之心 [人工智能资源( ...

  6. 【AI学院】新手如何学CV?老司机带学有三书籍《深度学习之图像识别》,赠书8本...

    为什么以及怎么学计算机视觉? 作为一个普通的程序员,如果能转型成为一个计算机视觉算法工程师,带来的不仅是高薪,还有从劳动密集型工种转化为智力密集型工种带来的"阶级跃迁".因为相对于 ...

  7. 【AI创新者】TensorFlow贡献者黄文坚:解读对比13个深度学习框架后的选择

    [AI创新者]是CSDN人工智能频道精心打造的专栏,本期主人公是PPmoney大数据算法总监黄文坚,他将为大家讲述Google深度学习框架TensorFlow以及他与唐源共同著作的<Tensor ...

  8. 一文带你了解GaussDB(DWS) 的Roach逻辑备份实现原理

    摘要:Roach工具是GaussDB(DWS)推出的一款主力的备份恢复工具,包含物理与逻辑备份两种主要能力,本文着重于讲解Roach逻辑备份的实现原理. 一.简介 在大数据时代,数据的完整和可靠性成为 ...

  9. 干货丨手把手带你玩转机器学习和深度学习

    俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据 ...

最新文章

  1. maven的pom.xml用<exclusion>解决版本问题
  2. 语法手册_是真的猛!SQL 语法速成手册
  3. POJ2402 Palindrome Numbers 回文数
  4. (精)【ACM刷题之路】POJ题目详细多角度分类及推荐题目
  5. 800多名各国院士热忱参与 第三届“科学探索奖”名单公布
  6. SharePoint 入门书籍推荐 转载来源http://www.cnblogs.com/jianyus/p/3513238.html
  7. 博士的浪漫,就是把你写进论文致谢,保存一辈子
  8. VB:常用内部函数大全,你会了几个呢?
  9. Smartisan OS ROM 小米手机 2/2S 标准版 刷机教程
  10. python初学者编程指南源码_适合新手的开源项目(Python 篇)
  11. macbook-M1的idea下集成svn环境
  12. ESP8266的AT指令集
  13. 开源ext2read代码走读之-如何读取MBR分区的内容
  14. 新年祝福短信app(源码)
  15. freemarker 导出word文件中包含图片
  16. 信息安全工程师学习笔记《第三章》
  17. 新款Macbook Pro可以升级固态硬盘吗?
  18. 蔚然的风,你一阵吹过
  19. 邻居子系统之ARP协议数据处理过程
  20. 网站优化:SEO网站优化常识以及我如何学习?

热门文章

  1. java毕业设计智能小区物业管理系统Mybatis+系统+数据库+调试部署
  2. 完美Zotero文件同步,Zotero+Koofr+OneDrive神器叠buff
  3. 微信小程序生成海报 poster
  4. 经济学硕士读计算机博士,去美国那些大学攻读经济学博士比较好?看完你就清楚了...
  5. 蓝绿部署、红黑部署、AB测试、灰度发布、金丝雀发布、滚动发布的概念与区别
  6. Java面试题大全带答案 40道
  7. 金融知识普及知识竞赛
  8. WPS/WORD论文格式调整方法
  9. gnuplot绘制xxx.plt文件生成图形
  10. GraphQL:你的容颜,十万光年