点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:专知

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

摘要

机器学习可以提供对数据的深刻见解,从而使机器能够做出高质量的预测,并已广泛用于诸如文本挖掘,视觉分类和推荐系统之类的实际应用中。但是,大多数复杂的机器学习方法在处理大规模数据时会耗费大量时间。这个问题需要大规模机器学习(LML),其目的是从具有可比性能的大数据中学习模式。在本文中,我们对现有的LML方法进行了系统的综述,为该领域的未来发展提供了蓝图。我们首先根据提高可伸缩性的方式来划分这些LML方法:1)简化计算复杂度的模型,2)优化计算效率的近似值,以及3)提高计算的并行性。然后,根据目标场景对每种方法进行分类,并根据内在策略介绍代表性方法。最后,我们分析其局限性并讨论潜在的方向以及未来有望解决的开放问题。

介绍

机器学习使机器能够从数据中学习模式,从而无需手动发现和编码模式。尽管如此,相对于训练实例或模型参数的数量,许多有效的机器学习方法都面临二次时间复杂性[70]。近年来,随着数据规模的迅速增长[207],这些机器学习方法变得不堪重负,难以为现实应用服务。为了开发大数据的金矿,因此提出了大规模机器学习(LML)。它旨在解决可用计算资源上的常规机器学习任务,特别着重于处理大规模数据。LML可以以几乎线性(甚至更低)的时间复杂度处理任务,同时获得可比的精度。因此,它已成为可操作的见解的大数据分析的核心。例如,Waymo和Tesla Autopilot等自动驾驶汽车在计算机视觉中应用了卷积网络,以实时图像感知周围环境[115];诸如Netflix和Amazon之类的在线媒体和电子商务站点从用户历史到产品推荐都建立了有效的协作过滤模型[18]。总而言之,LML在我们的日常生活中一直扮演着至关重要的和不可或缺的角色。

鉴于对从大数据中学习的需求不断增长,对此领域的系统调查变得非常科学和实用。尽管在大数据分析领域已经发表了一些调查报告[12],[33],[54],[193],但它们在以下方面还不够全面。首先,它们大多数只专注于LML的一个观点,而忽略了互补性。它限制了它们在该领域的价值,并无法促进未来的发展。例如,[12]专注于预测模型而没有发现优化问题,[33]在忽略并行化的同时回顾了随机优化算法,[193]仅关注了 大数据处理系统,并讨论系统支持的机器学习方法。其次,大多数综述要么失去对所审查方法的洞察力,要么忽视了最新的高质量文献。例如,[12]缺乏讨论模型的计算复杂性的讨论,[33]忽略了处理高维数据的优化算法,[120]将其研究限于Hadoop生态系统中的分布式数据分析。

从计算角度回顾了200多篇Paperson LML,并进行了更深入的分析,并讨论了未来的研究方向。我们为从业者提供查找表,以根据他们的需求和资源选择预测模型,优化算法和处理系统。此外,我们为研究人员提供了有关当前策略的见解,以更有效地开发下一代LML的指南。我们将贡献总结如下。

首先,我们根据三个计算角度对LML进行了全面概述。具体来说,它包括:1)模型简化,通过简化预测模型来降低计算复杂性;2)优化近似,通过设计更好的优化算法来提高计算效率;3)计算并行性,通过调度多个计算设备来提高计算能力。

其次,我们对现有的LML方法进行了深入的分析。为此,我们根据目标场景将每个角度的方法划分为更精细的类别。我们分析了它们促进机器学习过程的动机和内在策略。然后,我们介绍了具有代表性的成就的特征。此外,我们还回顾了混合方法,这些方法共同改善了协同效应的多个视角。

第三,我们从各个角度分析了LML方法的局限性,并根据其扩展提出了潜在的发展方向。此外,我们讨论了有关LML未来发展的一些相关问题。

本文的结构如下。我们首先在第2节中介绍了机器学习的一般框架,然后对其有效性和效率进行了高层次的讨论。在第3节中,我们全面回顾了最新的LML方法并深入了解了它们的好处和优势。局限性。最后,在第5节结束本文之前,我们讨论了解决第4节中的局限性和其他有希望的未解决问题的未来方向。

end

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博的公众号,欢迎关注,干货多多

王博的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章(上)

博士笔记 | 周志华《机器学习》手推笔记第八章(下)

博士笔记 | 周志华《机器学习》手推笔记第九章

点个在看支持一下吧

最新《大规模机器学习》2020综述论文相关推荐

  1. 史上最全《知识图谱》2020综述论文!!!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 知识图谱是当下的研究热点.最近18位学者共同撰写了一篇<知识图谱>综述 ...

  2. 【MIT港科大】最新《贝叶斯深度学习》2020综述论文,35页pdf全面阐述最新进展...

    来源:专知 来自MIT和香港科技大学的学者最新<贝叶斯深度学习>综述论文,值得关注! 地址: https://www.zhuanzhi.ai/paper/9b781282204cb581a ...

  3. 《元学习meta learning)》2020综述论文大全!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! [导读]元学习旨在学会学习,是当下研究热点之一.最近来自爱丁堡大学的学者发布了关于 ...

  4. 北大发布最新《图神经网络推荐系统》2020综述论文,27页pdf

    来源:专知 随着网络信息的爆炸式增长,推荐系统在缓解信息过载方面发挥了重要作用.由于推荐系统具有重要的应用价值,这一领域的研究一直在不断涌现.近年来,图神经网络(GNN)技术得到了广泛的关注,它能将节 ...

  5. 《知识图谱》2020综述论文,18位作者, 130页pdf,547篇参考文献

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :arvix.2003.02 ...

  6. 综述 | 国防科技大学发布最新「3D点云深度学习」综述论文

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :专知 [人工智能资源(书籍 ...

  7. 综述的综述!5 篇2020 年「图像分割算法」最佳综述论文详解

    在过去的一年中,计算机视觉领域出现了许多优秀的工作,并推动了相关领域的技术发展与进步.极市平台对2020年出现的全部计算机视觉综述论文进行了分方向梳理.本篇文章为2020年图像分割方向的综述论文汇总, ...

  8. 知识图谱最新权威综述论文解读:关系抽取

    上期我们介绍了2020年知识图谱最新权威综述论文<A Survey on Knowledge Graphs: Representation, Acquisition and Applicatio ...

  9. 机器学习领域各领域必读经典综述论文整理分享

    机器学习是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多门学科.专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性 ...

最新文章

  1. 神州数码与神州控股、神州信息共同主办首届技术年会,透露出什么信号?
  2. 茶香账簿小程序开发进度(1)
  3. [:zh]给机械课程设计的一封信[:] 2017-12-23
  4. 虚拟机上使用ghost xp
  5. python multithreading_操作系统OS,Python - 多进程(multiprocessing)、多线程(multithreading)...
  6. 简易 责任链的两种实现方式
  7. 深度学习的实用层面 —— 1.11 神经网络的权重初始化
  8. php文章自动采集器,使用php蓝天采集器抓取今日头条ajax的文章内容
  9. pycharm的background task一直更新index,速度慢的解决方法
  10. 数组中的键值对去重_javascript利用对象键值对中键的唯一性实现数组去重
  11. 企业微信发送应用消息的实现
  12. 无刷直流电机计算转速
  13. 开源开放 | OpenKG发布第二批并更新近十个新冠知识图谱开放数据集
  14. 台式电脑主板插线步骤图_电脑主板开关接线图解教程(图文)
  15. STM32L476+STM32cubeMx+Freemodbus移植记录
  16. android 手指滑动顺时针逆时针判断
  17. flexbox布局详解
  18. Python - PyQT5开发UI界面 - 环境搭建
  19. java后台如何给数据给前端_JAVA后台 关于如何从后台传递信息在jsp前端页面显示...
  20. 手把手教你PyTorch项目:YOLO v3目标检测

热门文章

  1. mysql锁与程序锁_sql 锁类型与锁机制
  2. 如何计算近似纳什均衡_通证经济系列之纳什均衡
  3. 让计算机等待的函数_第56p,装饰器,闭包函数的应用
  4. 前端证券项目_证监会公告[2018]6号 证券公司投资银行类业务内部控制指引
  5. python如何使用geotools_Python pygeotools包_程序模块 - PyPI - Python中文网
  6. php怎么学小程序,PHP学习之路之Hello World小程序
  7. 打印循环换行_一个案例轻松认识Python 循环语句(for)——10以内的素数
  8. 用计算机转换层次的例子,两类层次分析法的转换及在应用中的比较-计算机工程与应用.PDF...
  9. linux raw格式改名img,4款Linux下的RAW格式图片编辑软件
  10. SQL SERVER数据库附加是只读的解决方法