TF之AutoML框架:AutoML框架的简介、特点、使用方法详细攻略

目录

AutoML框架的简介

AutoML框架的特点

AutoML框架的使用方法

AutoML VS AutoKeras 框架


AutoML框架的简介

AutoML官网:https://www.automl.org/

自动化机器学习,简单来说就是一种自动化任务的方法:预处理并清理数据、选择并构建适当的功能、选择合适的模型系列、优化模型超参数、后处理机器学习模型、批判性地分析所获得的结果。

在机器学习自动化方面,谷歌的 AutoML 无疑地位稳固。AutoML 基于谷歌最新的图像识别技术神经架构搜索( Neural Architecture Search ,NAS)。NAS 是一种算法,会根据特定数据集搜索最佳神经网络架构,以在该数据集上执行特定任务。AutoML 是一套机器学习工具,可以轻松训练高性能深度网络,而无需用户掌握深度学习或 AI 知识,所有你需要的只是标记数据!

AutoML是为非ML专家提供机器学习的方法和过程,以提高ML的效率,加速机器学习的研究。ML近年来取得了相当大的成就,越来越多的学科依赖于它。然而,这一成功至关重要地依赖于人类学习专家执行手动任务。由于这些任务的复杂性常常超出非ML专家,ML的应用的快速增长产生了对现成的机器学习方法的需求,这些方法可以容易地使用且无需专家知识。我们称之为以机器学习自动化的渐进自动化为目标的研究领域。

AutoML可以帮助选择模型并选择超参数。这个术语多被用来描述模型选择和/或超参数优化的自动化方法。这些方法适用于许多类型的算法,例如随机森林,梯度增强机器,神经网络等,AutoML库、研讨会、研究和竞赛都可以被囊括进这一领域。

理解:一般情况下,进行机器学习首先需要大量的训练数据,再由机器学习工程师/数据科学家对数据进行分析,设计算法形成训练模型;这需要大量的专业知识。但是,如果使用AutoML,就像是在使用一个工具,我们只需要将训练数据集传入AutoML,那么这个工具就会自动帮我们生成参数和模型,形成训练模型,这样即使不具备机器学习方面深入的专业知识也可以进行机器学习方面的工作。

1、AutoML库:包括auto-sklearn(将AutoWEKA扩展为python)、H2O AutoML和TPOT。 AutoML.org(以前称为ML4AAD,用于自动算法设计的机器学习)自2014年以来,一直被用在ICML等机器学习学术会议上。
(1)、在谷歌发布AutoML之前,业内已经存在不少AutoML库。其中最早的是2013年发布的AutoWEKA,其可以自动选择模型并选择超参数。
2、Cost:AutoML价格也并不算亲民,每小时收费20美元。
(1)、此外,一旦你开始训练,则无法导出模型,并且得用谷歌提供的API在云上运行你的网络,这些限制看起来都不是很方便

AutoML框架的特点

1、机器学习(Machine Learning, ML)近年来取得了相当大的成功,越来越多的学科需要依赖它。然而,这个成功的关键是需要人类机器学习工程师完成以下的工作:

  • 预处理数据
  • 选择适当的功能
  • 选择一个适当的模型选择系列
  • 优化模型超参数
  • 后处理机器学习模型
  • 严格分析所得的结果

2、AutoML借鉴了机器学习的许多学科,主要是:

  • 贝叶斯优化
  • 结构化数据和大数据的回归模型
  • Meta 学习
  • 转移学习
  • 组合优化

AutoML框架的使用方法

1、AutoML的主要问题可以由三部分构成:特征工程、模型选择、算法选择。

(1)、特征工程

特征工程在机器学习中有着举足轻重的作用。在AutoML中,自动特征工程的目的是自动地发掘并构造相关的特征,使得模型可以有最优的表现。除此之外,还包含一些特定的特征增强方法,例如特征选择、特征降维、特征生成、以及特征编码等。这些步骤目前来说都没有达到自动化的阶段。

上述这些步骤也伴随着一定的参数搜索空间。第一种搜索空间是方法自带的,例如PCA自带降维参数需要调整。第二种是特征生成时会将搜索空间扩大。

(2)、模型选择

模型选择包括两个步骤:选择一个模型,设定它的参数。相应地,AutoML的目的就是自动选择出一个最合适的模型,并且能够设定好它的最优参数。

(3)、算法选择

对于算法选择,AutoML的目的是自动地选择出一个优化算法,以便能够达到效率和精度的平衡。常用的优化方法有SGD、L-BFGS、GD等。使用哪个优化算法、对应优化算法的配置,也需要一组搜索空间。

AutoML VS AutoKeras 框架

  AutoML AutoKeras
家长 谷歌的TensorFlow Keras
花费 20 dollar/h free
开源 No Yes
基于云 yes(训练和评价) No
支持的模型 用于分类的卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM) 用于分类的卷积神经网路(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)
核心技术 带梯度策略更新的强化学习 高效神经架构搜索(参见《Efficient NeuralArchitecture Search via Parameter Sharing》

参考文章
分享一篇比较全面的AutoML综述

TF之AutoML框架:AutoML框架的简介、特点、使用方法详细攻略相关推荐

  1. DL之DNN优化技术:DNN中参数初始化【Lecun参数初始化、He参数初始化和Xavier参数初始化】的简介、使用方法详细攻略

    DL之DNN优化技术:DNN中参数初始化[Lecun参数初始化.He参数初始化和Xavier参数初始化]的简介.使用方法详细攻略 导读:现在有很多学者认为,随着BN层的提出,权重初始化可能已不再那么紧 ...

  2. TF之AutoML之AdaNet框架:AdaNet框架的简介、特点、使用方法详细攻略

    TF之AutoML之AdaNet框架:AdaNet框架的简介.特点.使用方法详细攻略 目录 AdaNet框架的简介 AdaNet框架的特点 AdaNet框架的使用方法 AdaNet框架的简介 谷歌开源 ...

  3. DL框架之AutoKeras框架:深度学习框架AutoKeras框架的简介、特点、安装、使用方法详细攻略

    DL框架之AutoKeras框架:深度学习框架AutoKeras框架的简介.特点.安装.使用方法详细攻略 Paper:<Efficient Neural Architecture Search ...

  4. DL框架之Caffe:深度学习框架之Caffe的简介、安装、使用方法详细攻略

    DL框架之Caffe:深度学习框架之Caffe的简介.安装.使用方法详细攻略 目录 Caffe的简介 Caffe的安装 Caffe的使用方法 1.基本函数 ​ Caffe的简介 全称Convoluti ...

  5. TF之data_format:data_format中的NHWCNCHW简介、转换的详细攻略

    TF之data_format:data_format中的NHWC&NCHW简介.转换的详细攻略 目录 NHWC&NCHW简介 NHWC&NCHW转换 NHWC&NCHW ...

  6. Py之dlib:Python库之dlib库的简介、安装、使用方法详细攻略

    Py之dlib:Python库之dlib库的简介.安装.使用方法详细攻略 目录 dlib库的简介 dlib库的安装 dlib库的使用函数 0.利用dlib.get_frontal_face_detec ...

  7. db2top详细使用方法_Py之PIL:Python的PIL库的简介、安装、使用方法详细攻略

    Py之PIL:Python的PIL库的简介.安装.使用方法详细攻略 目录 PIL库的简介 PIL库的安装 PIL库的用方法 1.几何图形的绘制与文字的绘制 2.绘制图形的各种案例 PIL库的简介 PI ...

  8. NLP:自然语言处理技术近十年发展技术更迭的简介、案例之详细攻略(持续更新)

    NLP:自然语言处理技术近十年发展技术更迭的简介.案例之详细攻略(持续更新) 目录 自然语言处理技术近十年发展技术更迭的简介.案例

  9. Computer:路由器、交换机、猫Modem的简介、区别之详细攻略

    Computer:路由器.交换机.猫Modem的简介.区别之详细攻略 目录 路由器.交换机的简介 交换机 路由器 猫Modem 外置式Modem的软件安装 外置式Modem的硬件安装 路由器.交换机. ...

最新文章

  1. nodejs之http-proxy几点常见问题
  2. Mysql事务隔离级别及MVCC(多版本并发控制)
  3. 【NLP】图解 BERT 预训练模型!
  4. BZOJ3435[Wc2014]紫荆花之恋——动态点分治(替罪羊式点分树套替罪羊树)
  5. CSS3 Media Query实现响应式Web设计(针对不同移动设备宽度)
  6. nohup java 运行main_在linux下利用nohup来后台运行java程序
  7. 《Spring Cloud》学习(一) 服务治理!
  8. 阿昌教你Linux密码忘记后如何重置
  9. eclipse优化设置
  10. 互联网公司起名,其实都有套路的!
  11. js 内置对象常用方法
  12. Open vStorage —— 虚拟化的存储路由系统
  13. 100%概率与任意好友获取QQ幸运字符的方法
  14. 小熊派鸿蒙开发板,小熊派-鸿蒙#183;季开发板入门(一)
  15. handler图片自动切换+listview+GridView+侧滑菜单+fragment
  16. i2c的IOL及上拉电阻
  17. CentOS7安装squid代理服务器
  18. 对于多线程程序,单核cpu与多核cpu是怎么工作的
  19. 单细胞论文记录(part7)--DL and alignment of spatially resolved single-cell transcriptomes with Tangram
  20. 物理层 ,物理层功能,物理层设备,通信方式,物理层传输介质

热门文章

  1. 安装和规划邮件服务器
  2. leetcode396. Rotate Function
  3. Python - MySQL数据库操作
  4. C#开发微信门户及应用(21)-微信企业号的消息和事件的接收处理及解密
  5. fdisk分区命令详解与fdisk非交互式分区
  6. C#中的信号量---Semaphore
  7. 实例详细讲解ASP生成静态页面方法
  8. UT斯达康XV6700的写号方法[图]
  9. java jar包命令行下可以双击不运行解决方法(改变java默认图标)
  10. 在tomcat中部署web项目