https://www.toutiao.com/i6716539079183303181/

我大概在两年前的时候开始关注深度学习自动化相关的技术,AI自动化的那天早晚都会到来,它不仅会把图像识别等技术自动化,也会逐渐蚕食写程序,设计类的工作岗位,最后把开发AI的人也给干掉,这一篇我们先来大致看看在深度学习领域,它们已经做到什么程度了。基本上所有的研究都是从谷歌开始,谷歌再次全面领导了新的革命。

作者&编辑 | 言有三

作为第一篇,我们先粗略介绍一下AutoML技术是什么,以及可以做些什么?

1 什么是AutoML

所谓AutoML,全称是Automated Machine Learning,即自动机器学习技术,它的发展现状可以参考下面的综述文章。

Zoller M, Huber M F. Survey on Automated Machine Learning.[J]. arXiv: Learning, 2019.

AutoML的目标是让机器学习的整个流程的创建完全自动化,从应用领域来说,这通常要包括数据的使用,特征的选择,模型架构的设计,优化方法的使用,所以这些方向都会涉及到超参数的自动调节。

有了AutoML技术后,各个领域的专家便能够低门槛地使用机器学习技术,而不用依赖于机器学习专家。

2 数据使用与特征选择

智能系统与机器学习技术的发展,本身就伴随着对数据的使用方法的进化。从传统的专家系统,到有监督的机器学习算法,到深度学习,本身就属于AutoML的范畴,它解决了特征选择的问题,让特征的学习来源于数据,而不是手工设计。

所以深度学习也被称之为特征学习,它利用CNN等架构,实现了特征选择的过程。

另一方面,在机器学习/深度学习领域中,还有一个很重要的问题,就是数据增强。在解决各类任务的过程中,常常没有足够多的数据,数据太少便意味着过拟合,因此数据增强技术至关重要。

曾几何时,我们采用各种各样的几何变换,颜色变换策略来进行数据增强。随机裁剪,颜色扰动,都对提升模型的泛化能力起着至关重要的作用。

技术发展到了现在,AutoML技术开始在数据增强领域展露头脚,以Google Brain提出的AutoAugment为代表的方法,使用增强学习对不同的任务学习到了各自最合适的增强方法,具体细节,大家可以参考论文和我们之前的往期文章「技术综述」深度学习中的数据增强方法都有哪些?,以后我们也会继续开篇讲述更新的研究。

Cubuk E D, Zoph B, Mane D, et al. AutoAugment: Learning Augmentation Policies from Data.[J]. arXiv: Computer Vision and Pattern Recognition, 2018.

数据使用和特征选择作为最早被AutoML技术攻陷的领域,是机器学习算法走向智能和商业化落地的关键。

3 网络结构设计NAS

一直以来,网络结构的设计是一个非常需要经验且具有挑战性的工作,研究人员从设计功能更加强大和更加高效的模型两个方向进行研究,我之前在知乎上也做了两个live直播讲述对应的核心技术,感兴趣可以去听听。

随着各类经典网络设计思想的完善,如今要手工设计出更强大的模型已经很难,而以AutoML为代表的技术在三年前开始被研究。

Google首次提出了自动设计网络模型的思想,利用增强学习进行最佳架构的搜索。学习方法如下,基本思想是从一个定义空间中选取网络组件,使用网络的准确率作为指导指标,使用强化学习进行学习。

学习到的网络结构如下:

从上面的结构可以看出,它拥有以下特点:

(1) 跨层的连接非常多,说明信息融合非常重要。

(2) 单个通道数不大,这是通道使用更加高效的表现。

从Flops指标来看,已经非常的高效,不过因为结构相对复杂,实际在硬件平台上运行时性能并不一定优于MobileNet等模型,但是仍然是非常高效的网络。

以上研究催生了Google Cloud AutoML,并在2018年1月被Google发布,AutoML技术的研究进入高潮,这两年成为机器学习/深度学习的大热门。

我们还没有更新到相关内容,可以参考隔壁机器之心等媒体的文章,以及相关综述。现在NAS算法所用的基本结构和模块都是已有的模块,未来的方向应该是更广阔的搜索空间。

[1] Zoph B, Le Q V. Neural Architecture Search with Reinforcement Learning[J]. international conference on learning representations, 2017.
[2] Zoph B, Vasudevan V, Shlens J, et al. Learning Transferable Architectures for Scalable Image Recognition[J]. computer vision and pattern recognition, 2018: 8697-8710.
[3] Elsken T, Metzen J H, Hutter F, et al. Neural Architecture Search: A Survey[J]. Journal of Machine Learning Research, 2018, 20(55): 1-21.

4 优化方法的搜索

曾几何时,我们设计,比较,分析sigmoid,tanh,relu等激活函数对网络性能的影响。

而Google Brain提出的以Swish为代表的方法,在一系列一元函数和二元函数组成的搜索空间中,进行了组合搜索实验,利用数据学习到了比ReLU更好的激活函数,可以参考往期文章「AI初识境」激活函数:从人工设计到自动搜索。

Ramachandran P, Zoph B, Le Q V. Searching for activation functions[J]. arXiv preprint arXiv:1710.05941, 2017.

曾几何时,我们还在争论是最大池化好还是平均池化好,如今基于数据的池化策略已经被广泛研究。

Saeedan F, Weber N, Goesele M, et al. Detail-Preserving Pooling in Deep Networks[J]. computer vision and pattern recognition, 2018: 9108-9116.

曾几何时,我们还在不知道选择什么样的归一化方法好,如今,对每一个网络层学习最合适的归一化策略也是可行的。

Luo P, Ren J, Peng Z, et al. Differentiable Learning-to-Normalize via Switchable Normalization[J]. international conference on learning representations, 2019.

曾几何时,我们在各种各样的优化方法中迷茫,如今,自动学习优化方法也开始被研究。

Bello I, Zoph B, Vasudevan V, et al. Neural Optimizer Search with Reinforcement Learning[J]. international conference on machine learning, 2017: 459-468.

曾几何时,我们还在想尽办法设计损失函数,如今,使用AutoML进行损失函数的学习也开始了。

Wu L, Tian F, Xia Y, et al. Learning to Teach with Dynamic Loss Functions[J]. neural information processing systems, 2018: 6466-6477.

曾几何时,我们在各种模型压缩技巧中鏖战,如今,使用AutoML技术用于模型压缩的研究也新鲜出炉。

He Y, Lin J, Liu Z, et al. AMC: AutoML for Model Compression and Acceleration on Mobile Devices[J]. european conference on computer vision, 2018: 815-832.

这可能是一个新的时代的开始,GAN正在各大领域中狂奔,AutoML又开始席卷各大领域。

如果你想好好学习AutoML,给大家推送一个GitHub项目,一本书,东西在精不在多,希望对你有用。另外,关注我们肯定是没错的。

https://github.com/hibayesian/awesome-automl-papers
https://www.automl.org/wp-content/uploads/2019/05/AutoML_Book.pdf

总结

如果你足够细心,应该就会发现上面所有的研究,基本上都离不开Google的身影。感谢谷歌,正在让深度学习的一切开始自动化。同时也要警惕Google,它正在抢走你的饭碗。

「AutoML」AutoML专栏上线,跟Google一起见证调参党的末日?相关推荐

  1. 【AutoML】AutoML专栏上线,跟Google一起见证调参党的末日?

    大家好,今天开设新专栏<AutoML>,即Automated Machine Learning.在这个专栏中,我们会讲述AutoML相关的内容,覆盖数据使用,模型架构,优化算法等内容. 我 ...

  2. 【强化学习】强化学习专栏上线,60多篇文章等你follow

    大家好,今天行健在有三AI开设新专栏<强化学习>.在这个专栏中,我们会分为五大模块去讲解强化学习涉及到的方方面面,包括强化学习基础理论宗派,经典算法,编程实践,前沿理论和文献,强化学习应用 ...

  3. 【NLP】自然语言处理专栏上线,带你一步一步走进“人工智能技术皇冠上的明珠”。...

    大家好,今天小Dream哥在有三AI开设新专栏<自然语言处理(NLP)>.在这个专栏中,我们会讲述自然语言处理相关的内容,覆盖自然语言处理基础理论,常用模型以及实际应用等内容. 自然语言处 ...

  4. 「干货」橙留香博客导读:专栏系统分类和博客归纳总结

    也许每个人出生的时候都以为这世界都是为他一个人而存在的,当他发现自己错的时候,他便开始长大 少走了弯路,也就错过了风景,无论如何,感谢经历 0x01 前言 为了更好地帮助博友同学学习作者同学的博客,方 ...

  5. Update|亚洲精品菜订餐平台「Chowbus」获400万美金新融资,由Greycroft和FJ labs领投...

    36氪获悉,我们曾报道过的创立于芝加哥的亚洲精品菜订餐平台「Chowbus」,近期完成 400 万美金的新一轮融资,由 Greycroft.FJ labs 领投,HPA.Fika Ventures 跟 ...

  6. ChatGPT还在2G冲浪?新模型「youChat」:我已能够解说2022世界杯

    视学算法报道 编辑:蛋酱.小舟 youChat 能成为搜索引擎变革的先行者吗? ChatGPT 自推出以来就被寄予厚望,一些人认为它会取代搜索引擎,成为「改变游戏规则的人」. 真的会有这一天吗?至少, ...

  7. #####好好好####从Google Visor到Microsoft NNI再到Advisor调参服务接口发展史

    从Google Visor到Microsoft NNI再到Advisor调参服务接口发展史 tobe Contributor to the world. 10 人赞了该文章 介绍 从规则编程到机器学习 ...

  8. 「AutoML」强化学习如何用于自动模型设计(NAS)与优化?

    作者&编辑 | 言有三 一直以来,网络结构的设计是一个非常需要经验且具有挑战性的工作,研究人员从设计功能更加强大和更加高效的模型两个方向进行研究,随着各类经典网络设计思想的完善,如今要手工设计 ...

  9. 一文看懂深度学习新王者「AutoML」:是什么、怎么用、未来如何发展?

    原作:George Seif 夏乙 安妮 编译整理 量子位 出品 | 公众号 QbitAI AutoML和神经架构搜索(NAS),是深度学习领域的新一代王者. 这些方法能快糙猛地搞定机器学习任务,简单 ...

  10. 「刘一哥GIS」系列专栏《QGIS入门实战精品教程(配套案例数据)》

    「刘一哥GIS」系列专栏<QGIS入门实战精品教程(配套案例数据)>全新上线了,欢迎广大GISer朋友关注,一起探索GIS奥秘,分享GIS价值! 本专栏以实战案例的形式,深入浅出地介绍了Q ...

最新文章

  1. 修复 Xcode 错误 “The identity used to sign the executable is no longer valid”
  2. Codeblocks和gdb调试 (转)
  3. Qt5\MinGw编译器快速解决-QMYSQL driver not loaded问题
  4. 《scikit-learn》决策树之回归树
  5. 父子类之间,成员函数重写、重载以及重定义的区别
  6. php提取bing背景,PHP代码获取bing每日背景
  7. ireport 用html页面上 图片怎么都出不来 全是红叉的处理办法
  8. CTRL+ALT快捷键汇总
  9. [2.1]-AutoSAR零基础学习-汽车电子控制系统简介
  10. 原理图和PCB设计流程概述
  11. QRCode.js 生成二维码放大后会模糊的问题
  12. Zeppelin的求学之路(1)—— 简介 和 从源码Build的安装并配置他的Spark解析器
  13. 二维码名片页面的样式设计
  14. ext4文件系统错误处理机制
  15. 服务器2008系统安全狗,win2008 r2 服务器安全设置之安全狗设置图文教程
  16. python随机生成英文字符串_Python练习第六题,生成随机字母
  17. 【计算机组成原理】寻址方式
  18. 洗衣店小程序v2.6.5+小程序前端全开源版安装教程
  19. 理光c2004文件服务器错误,理光Ricoh MP C2004exSP 驱动
  20. k8s搭建php开发环境,在k8s上部署第一个php应用

热门文章

  1. firefox图片不存在就显示小红叉的方法
  2. Oracle 12c:配置em,解决em登录问题
  3. 冬瓜哥送你元宵大礼盒啦!!
  4. JUC- 常用的辅助类
  5. 金蝶KIS商贸版—(业务结账)期末结账操作介绍
  6. 解决用友固定资产出现的“不能月末结账,可能月末未结账”的处理办法
  7. 『尼罗河魅影之谜』的故事模式与推理内核
  8. thinkpadt410接口介绍_thinkpadt410价格与评测介绍【图文】
  9. 用缠论做量化(买卖点/品种机会/策略应用全解读)
  10. 【雅思大作文考官范文】——第十五篇:'high salaries' essay