AutoML 是否被过度炒作?
来 源 | AI开发者
作 者 | Denis Vorotyntsev
翻 译 | 呀啦呼(Tufts University | CS)审 校 | 唐里、鸢尾、Pita
1 AutoML是嘛玩意?
Data Science projects(数据科学项目)
AutoML
- AutoML选择了一种预处理数据的策略:如何处理不平衡的数据;如何处理不平衡的数据;如何填充缺失值;outlier的删除,替换或保留;如何编码类别和多类别列;如何避免目标泄漏;如何防止内存错误;等等。
- AutoML生成很多新的特征并且选择当中有意义的;
- AutoML自动选择适合的模型(Linear models, K-Nearest Neighbors, Gradient Boosting, Neural Nets, 等等);
- AutoML为选择的模型进行参数优化(比如tree-based的模型有多少子树数量和子采样数, 神经网络的learning rate和epochs数量;
- AutoML建立了一个模型集成(译者:大杂烩,嘛都有)来尽可能的让模型分数更高。
2 AutoML 的动机
AutoML将填补数据科学市场中供需之间的缺口
AutoML将会大幅节省数据科学团队的时间
Oversimplified rules:
if (Gain from model > Costs of DS team time) → Time savings are not needed.
if (Gain from model <= Costs of DS team time) → Are you solving the right problem? ?
AutoML比普通的数据科学家更厉害
- 5-StratifiedKFold;
- 用于分类列的Catboost编码器,如果您对CatBoost编码器不熟悉,请查看我之前的文章:Benchmarking Categorical Encoders(https://towardsdatascience.com/benchmarking-categorical-encoders-9c322bd77ee8);
- 数字列对的数学运算(+-* /)。新特征数量的上限:500;
- 模型:默认参数的LightGBM;
- 混合(OOF ranked predictions)
Score = (ROC AUC / ROC AUC of my baseline) * 100%
3 总结
- 如果你的公司想第一次使用其数据,整个顾问先咨询一下。
- 你应该让你的工作尽量地自动化。。。
- 。。。由于封装的解决方案得分很低,看起来并不像是正确的选择。
PS 引擎并不是一辆完整的车。
via https://towardsdatascience.com/automl-is-overhyped-1b5511ded65f
(完)
?关注“Python与人工智能社区”
王老湿目前建立了Python、爬虫、数据分析、机器学习、AI实战、自然语言处理、计算机视觉、推荐系统等方向的读者交流群,大家可以添加王老湿的微信进行加群
近期专栏推荐 (点击下方标题即可跳转)
1.
2.
3.
4.
点下「在看」,给文章盖个戳吧!?
AutoML 是否被过度炒作?相关推荐
- 自动机器学习(AutoML)
自动机器学习(AutoML) 不再需要苦恼于学习各种机器学习的算法 目录: 一.为什么需要自动机器学习 二.超参数优化 Hyper-parameter Optimization 三.元学习 Meta ...
- 从谷歌AutoML到百度EasyDL,AI大生产时代,调参师不再是刚需
出品 | AI科技大本营 头图 | 付费下载于视觉中国 2018 年,Google Cloud 宣布将 AutoML 作为机器学习产品的一部分.至此,AutoML 开始进入大众的视野. 实际上,201 ...
- 疫情排查节时86%?不会代码也能玩转模型训练?腾讯大神揭秘语音语义及AutoML黑科技 | 内含福利...
出品 | AI科技大本营(ID:rgznai100) 2020年7月3日,AI ProCon 2020 AI开发者万人大会,隆重举行!作为CSDN策划并主办的系列技术「开发者大会」之一,本次大会通过线 ...
- 自动化神经网络理论进展缓慢,AutoML算法的边界到底在哪?
作者 | 夕颜 出品 | CSDN(ID:CSDNnews) 「AI 技术生态论」 人物访谈栏目是 CSDN 发起的百万人学 AI 倡议下的重要组成部分.通过对 AI 生态顶级大咖.创业者.行业 K ...
- 【公开课预告】AutoML知多少
5月7日周四19:00,商汤泰坦公开课第010期,论文解读系列课程第二期即将开播!我们邀请到商汤科技的4位研究员,分享团队在AutoML方面的一系列研究工作,其中包含CVPR 2020.ICLR 20 ...
- 2019年,自动化机器学习AutoML技术还火吗? | BDTC 2019
整理 | 王银 出品 | AI科技大本营(ID:rgznai100) [导读]12 月 5-7 日,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN.中科天玑协办的中国大数据技术大会(BD ...
- 2020年趋势一览:AutoML、联邦学习、云寡头时代的终结
作者 | Roberto Sannazzaro,Ben Longstaff 译者 | 夕颜 出品 | AI科技大本营(ID:rgznai100) [导读]在 2020 年来临之际,新年前夕往往是人们回 ...
- 提高建模效率,改变手工作坊式生产,AutoML的技术研究与应用进展如何了?
整理 | 王银 出品 | AI科技大本营(ID:rgznai100) [导读]12 月 5-7 日,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN.中科天玑协办的中国大数据技术大会(BD ...
- AutoML未来可期,工程师的明天何去何从?
人工智能和机器学习建模专业技术人才紧缺,即使是高水平的人工智能专家,在大数据智能分析机器学习建模时,主要依靠人工经验,建模过程费时费力,缺少有效方法.为了解决这一突出问题,国内外出现了一种用机器学习解 ...
- 推荐系统中的前沿技术研究与落地:深度学习、AutoML与强化学习 | AI ProCon 2019...
整理 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 个性化推荐算法滥觞于互联网的急速发展,随着国内外互联网公司,如 Netflix 在电影领域,亚马逊.淘宝.京东等在电商领域,今日头 ...
最新文章
- pythonmysql查询转list_使用Python将Mysql的查询数据导出到文件的方法
- photoshop8.0 安装步骤及注意事项
- JAVA编程语言的基础知识(六)
- ajax异步加载和cmd,异步传输Ajax(JQ)
- 四种策略确保 RabbitMQ 消息发送可靠性!你用哪种?
- jQuery插件FontSizer实现自定义动态调整网页文字大小
- Windows Server AppFabric缓存参考实例和方案选择 2/3
- 阿里云 网站https设置 sll申请与nginx跳转配置
- 全网首发:使用命令行编译VS工程为Win32/x64
- mysql auto_increment建表_如何在MySQL中已创建的表中插入AUTO_INCREMENT
- Repeater的ItemCommand事件和ItemCreated事件,高手请跳过~
- 【一千个论文合集】计算机科学的26个细分领域近年必读论文集合
- 禁用EnableViewState和启用EnableViewStat时请注意
- SDNU_ACM_ICPC_2020_Winter_Practice_2nd C 离散化, lower_bound
- matlab射击小游戏,Matlab射箭小游戏设计,小虾米求救
- PowerDesigner 修改 DBMS
- 车联网上云最佳实践 七
- MATLAB基于小波变换的语音信号去噪算法改进
- 计算机截取当前页面,电脑截图怎么截
- 如何使用html实现在线秒表,js实现简单的秒表