深度学习并非万能:你需要避免这三个坑

https://mp.weixin.qq.com/s/ocehuXIh4w_6R545gCJOdA

作者:George Seif

编译:专知,小事

整理:Mandy, Sanglei, Simy

【导读】本文是人工智能专家George Seif撰写的博文,介绍了在当前深度学习比较火热的情景下需要避免的三个坑。

Three reasons that you should NOT use deep learning

深度学习在过去几年一直是人工智能领域最热门的话题。事实上,正是它激发了科学家、政府、大公司以及其他所有人对人工智能的极大新兴趣!这是一门很酷的科学,具有潜在的巨大的实用性和积极的应用。它正被用于金融、工程、娱乐、消费产品和服务等领域。

但是,所有应用都需要使用到深度学习吗?当我们开展一个新的项目时,我们需要不自觉地一开始就使用深度学习吗?

在有些情况下,使用深度学习是不合适的,我们需要选择一些别的方案。让我们来探讨一下这些情况吧。

深度学习不适用于小数据集

为了获得高性能,深度网络需要非常大的数据集。标注的数据越多,模型的性能就越好。获得标注良好的数据既昂贵又耗时。雇佣人工手动收集图片并标记它们根本没有效率可言。在深度学习时代,数据无疑是最有价值的资源。

最新的研究表明,实现高性能的网络通常需要经过数十万甚至数百万样本的训练。对于许多应用来说,这样大的数据集并不容易获得,并且获取成本高且耗时。对于较小的数据集,传统的ML算法(如回归、随机森林和支持向量机)通常优于深度网络。

 深度学习运用于实践是困难且昂贵的

深度学习仍然是一项非常尖端的技术。您可以像许多人一样获得快速简便的解决方案,特别是使用广泛使用的API,例如Clarifai和Google的AutoML。但如果你想做一些定制化的事情,这样的一些服务是不够的。除非你愿意把钱花在研究上,否则你就会局限于做一些和其他人稍微相似的事情。

这也是很昂贵,不仅是因为需要获取数据和计算能力所需的资源,还因为需要雇佣研究人员。深度学习研究现在非常热门,所以这三项费用都非常昂贵。当你做一些定制化的事情时,你会花费大量的时间去尝试和打破常规。

深层网络不易解释

深层网络就像是一个“黑盒子”,即使到现在,研究人员也不能完全理解深层网络的“内部”。深层网络具有很高的预测能力,但可解释性较低。由于缺乏理论基础,超参数和网络设计也是一个很大的挑战。

虽然最近有许多工具,如显著性映射(saliencymaps)和激活差异(activation differences),它们在某些领域非常有效,但它们并不能完全适用于所有应用程序。这些工具的设计主要用于确保您的网络不会过度拟合数据,或者将重点放在虚假的特定特性上。仍然很难将每个特征的重要性解释为深层网络的整体决策。

另一方面,经典的ML算法,如回归或随机森林,由于涉及到直接的特征工程,就很容易解释和理解。此外,调优超参数和修改模型设计的过程也更加简单,因为我们对数据和底层算法有了更深入的了解。当必须将网络的结果翻译并交付给公众或非技术受众时,这些内容尤其重要。我们不能仅仅说“我们卖了那只股票”或“我们在那个病人身上用了这药”是因为我们的深层网络是这么说的,我们需要知道为什么。不幸的是,到目前为止,我们所掌握的关于深度学习的所有证据或者解释都是经验主义的。​

深度学习并非万能:你需要避免这三个坑相关推荐

  1. 甲小姐对话稚晖君:深度学习并非AI的终点

    "人类不应该只存在在地球上,对于这么浩瀚的宇宙来说太浪费了." 作者 | 甲小姐 助理 | 沁云 近日,华为"天才少年".B站UP主稚晖君的新作自动驾驶自行车在 ...

  2. 深度学习(25)随机梯度下降三: 激活函数的梯度

    深度学习(25)随机梯度下降三: 激活函数的梯度 1. Activation Functions 2. Deriative 3. Sigmoid/Logistic (1) Derivative (2) ...

  3. 深度学习(7)TensorFlow基础操作三: 索引与切片

    深度学习(7)TensorFlow基础操作三: 索引与切片 一. 基础索引 1. Basic indexing 2. Numpy-style indexing 3. start : end 4. 切片 ...

  4. 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》

    深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...

  5. 深度学习模型压缩与加速技术(三):低秩分解

    目录 总结 低秩分解 定义 特点 1.二元分解 2.多元分解 参考文献 深度学习模型的压缩和加速是指利用神经网络参数的冗余性和网络结构的冗余性精简模型,在不影响任务完成度的情况下,得到参数量更少.结构 ...

  6. 神舟Z7-CT7NK配置深度学习环境遇到的问题,避免后续踩坑

    神舟Z7-CT7NK配置深度学习环境遇到的问题,避免后续踩坑) 安装双系统 网上有很多教程,将Ubuntu18安装在与win10同一固态硬盘上,启动系统速度会很快,如果将系统安装在机械硬盘上,启动速度 ...

  7. cnn 反向传播推导_深度学习中的参数梯度推导(三)下篇

    前言 在深度学习中的参数梯度推导(三)中篇里,我们总结了CNN的BP推导第一步:BP通过池化层时梯度的计算公式.本篇(下篇)则继续推导CNN相关的其他梯度计算公式. 注意:本文默认读者已具备深度学习上 ...

  8. 深度学习核心技术精讲100篇(三十五)-美团餐饮娱乐知识图谱——美团大脑揭秘

    前言 " I'm sorry. I can't do that, Dave." 这是经典科幻电影<2001: A Space Odyssey>里HAL 9000机器人说 ...

  9. 【杂谈】如何在言有三本人的随时答疑下, 长期而系统地学习深度学习和计算机视觉,这是有三AI的完整计划...

    对深度学习从业者要说的话 深度学习的前身是神经网络,属于机器学习技术中的一种,诞生于半个多世纪以前,随着计算硬件水平的提升,工业大数据的积累以及相关理论的完善,如今得以在各行各业大展拳脚.从应用领域来 ...

最新文章

  1. 零基础怎么学习web前端开发
  2. butterknife 插件_知道这个插件,能让你的项目里少写1000行代码
  3. 适合小白的卷积神经网络图解
  4. 事务日志已满,原因为“ACTIVE_TRANSACTION”
  5. ajax文件上传报400,js ajaxfileupload.js上传报错的解决方法
  6. QT的QTimer类的使用
  7. html文本打印lt;igt;字段,Web前端学习第九课,使用文本格式化标签
  8. python 实现装饰器设计模式
  9. Elastic-Job | 由浅入深一篇理解分布式定时任务的基本用法及简单原理解析
  10. office和计算机基础,国二ms才office计算机基础知识.ppt
  11. 开发交接文档_为开发人员创造更好的设计交接体验
  12. 秀球技:倒和其他无用
  13. 带权二部图匹配(KM算法)讲解及Matlab实现
  14. 浅谈Camera subsytem
  15. SpringBoot-logback配置输出Json格式日志
  16. 前沿关注 | 5G和边缘计算将如何改变AR和VR?
  17. wordcloud的常用函数
  18. 距阵乘以一个未知距阵得单位矩阵 怎么算_一个人可以 DIY 出什么高逼格的东西?...
  19. 技术支撑团队技术支持工程师的技能要求
  20. android友盟统计按钮点击次数,友盟统计按钮点击事件

热门文章

  1. 清华陈文光教授:AI 超算基准测试的最新探索和实践(附演讲视频)
  2. “智源论坛Live”报名 | 清华大学游凯超:领域适配前沿研究--场景、方法与模型选择...
  3. 2021全球产品经理大会蓄势待发!
  4. Rails工作效率和Java运行平台
  5. Ubuntu18.04+RTX 2080Ti+CUDA 10.0 +cuDNN+PyTorch搭建深度学习环境
  6. 04-VTK可视化管线(1)
  7. 为什么AI无法解决一般智能问题?
  8. 清华朱文武团队斩获NIPS 2018 AutoML挑战赛亚军,高校排名第一
  9. 自然语言处理领域重要研究及资源全索引!
  10. 无意中发现了一位清华大佬的代码模版