当前AutoML平台离“万能”还有一段距离

AutoML 成为热门技术方向,同时也面临着一些难题,这些难题有很大一方面来自于 不同数据之间解决问题手段的可迁移性 / 可复制性,解决不同问题的手段相似性或者可迁移性 / 可复制性越高,自动化越容易,反之越难

目前 AutoML 产品的目标数据主要有两类,一类是图像数据,一类是表数据。

图像数据

深度学习取得的最大的成功来自于图像领域,相比于传统图像分析处理做法最核心的点在于“自动”学习层次化特征,以前的图像分析都是需要人工设计很多种从原始像素提取特征的方法,需要很多专家经验,深度学习很好地解决了这个问题,使得特征可学习,将人工特征设计转变成了人工神经网络结构设计,对于图像领域的自动机器学习,很自然的一个想法就是,是否能进一步将人工神经网络结构设计里面的“人工”去掉

谷歌、微软、第四范式等针对图像数据的 AutoML 产品的核心点是自动化图像领域的神经网络结构设计,他们针对的主要数据是图像数据。图像数据之间的相似性较大,原始输入都是像素,问题解决方案可迁移性可复用性也较大,使得 AutoML 在图像数据上相对更加容易落地。

表数据

与图像数据原始输入都是像素不同的是,表数据是抽象数据不同的表数据之间没有很强的相似性,不同表数据各列的含义千差万别,另外表数据还跟实际业务密切相关,其中有很多时序性、概念漂移、数据包含噪声等等不同于传统机器学习的特性需要解决,因此表数据问题上 AutoML 落地的难度也会大很多,仅仅是自动神经网络结构设计是远远不够的

目前谷歌、微软在这方面成果相对较少,MIT 的自动特征是在这类问题上一个很不错的尝试,他们主要解决的问题是数据分布在多个表中,如何自动化地将这多个表的数据转化成最终机器学习所需要的单个表数据,但是除了这个问题,实际表数据的 AutoML 落地还需要解决更多的难题。在国内,第四范式在这类问题上是最早有成熟产品落地的,比如模型自带自动化特征的线性分形分类器,自动特征组合工具 FeatureGo,自动时序树模型工具 HE-TreeNet 等等,今年也会有更多更强大的自动化机器学习产品发布。

除此之外,涂威威还补充道:对于自然语言处理中的知识自动提取等也需要自动化的机器学习技术,这是目前很多 AutoML 产品所不涉及的。

AutoML之图数据与表数据相关推荐

  1. 在PPT中插入数据透视表(数据透视图)

    在PPT制作过程中,有时需要插入EXCEL中常用的数据透视表(数据透视图) 下面说一下方法:(以office2007为例) 首先,在EXCEL中选中要进行数据分析的数据区域,并定义区域名称.这里我们取 ...

  2. 数据透视表数据空白_更改数据透视表中的空白标签

    数据透视表数据空白 In a pivot table, you might have a few row labels or column labels that contain the text & ...

  3. 【Excel】数据透视表—数据透视表布局(显示)

    [Excel]数据透视表-标签合并居中 [Excel]数据透视表-新增一列(字段) [Excel]数据透视表-按年.季度.月份汇总报表 [Excel]数据透视表-简单数据分析实例 我们刚刚生成的一个数 ...

  4. excel数据透视表数据排序及excel表格转成word表

    目录 1.将excel表格粘贴到word中:(直接粘贴会出现各种不服!) 2.对透视表数据排序: 3.更改透视表数据源: 4.数据透视表的无效行标签如何清除(是否保留从数据源部分中删除的项目) 5.改 ...

  5. mysql 单表数据_Mysql--单表数据记录查询

    1.简单数据记录查询 1.1 简单数据查询 1.1.1 查询所有字段数据 例子: 1.1.2 "*"符号的使用 语法: 例子: 1.1.3 查询指定字段数据 例子: 1.2 避免重 ...

  6. hive表中的数据导出:表数据的导出7种方式

    将hive表中的数据导出到其他任意目录,例如linux本地磁盘,例如hdfs,例如mysql等等 insert导出 1)将查询的结果导出到本地 :第一种 insert overwrite local ...

  7. php 数据透视表,php – 使用Laravel模型过滤数据透视表数据

    假设我有三个表(这只是一个例子): users user_id username roles role_id name user_roles user_id role_id primary (bool ...

  8. Excel 数据透视表(图)的使用(备忘)

    Excel是办公学习离不开的工具,其数据处理的功能很强大,为了防止长时间不用忘记了使用细节整理了这篇博客 Excel数据透视表(图) step1: step2:鼠标点击框线 包含的数据就是数据源 一定 ...

  9. WEB数据透视表Pivot Table

    原文来自方案网 http://www.fanganwang.com/Product-detail-item-1451.html,欢迎转载. 关键字:透视表Pivot Table,交叉透视表,数据透视表 ...

最新文章

  1. 【NLP】NLP文本风格迁移,秒变金庸风
  2. Ubuntu 18.04 卡死
  3. 11 Interior-point methods and Conclusions
  4. matlab weibpdf函数,matlab建模常用函数
  5. Liferay 控制面板在指定文件夹添加Basic Document流程分析
  6. php memcache 类库,php操作Memcache的一个类库的方法(代码)
  7. Woderwate-Intouch驱动(包括施耐德,西门子,AB等的DASever、IOServer)
  8. shader 菲涅尔反射
  9. List.sort()方法使用拉姆达表达式进行排序的一个例子
  10. Device模块管理设备信息,用于获取手机设备的相关信息,如IMEI、IMSI、型号、厂商等
  11. 华为手机浏览器 onclick失灵的问题
  12. linux图片编辑工具,如何在Ubuntu 18.04中安装Pinta图像编辑器
  13. 张杰和机器人_「配天机器人|视点」来福谐波:90后张杰的“生意经”
  14. apt update Updating from such a repository can‘t be done securely, and is therefore
  15. minotaur的故事_Minotaur为Mesos,Kafka和Hadoop开发开源云
  16. Spark RDD 论文详解(三)Spark 编程接口
  17. 【转贴】合格的高级程序员
  18. 镭速传输 “0元百日计划”提前大曝光!Raysync传输协议要开放?
  19. 浙江大学控制科学与工程学院冯冬芹教授团队招聘FPGA工程师1名
  20. 什么是DDoS攻击?企业服务器是否需要DDoS防御

热门文章

  1. php设置404返回302,java - 服务器访问应用返回302或者404状态码
  2. 保留字(reserved field)是什么意思?
  3. pycharm提示:Usually first parameter of a method is named 'self'
  4. tensorflow教程 开始——Premade Estimators(预制评估器)
  5. tensorflow dataset_ops map()方法 (返回数据集通过函数“ map_func”的元素映射)
  6. win10如何将已有python环境变量添加到电脑中 错误 Fatal error in launcher: Unable to create process using pip.exe 解决办法
  7. 踩坑日记:Logstash同步数据库有type字段导致同步失败
  8. 项目管理:五大过程组十大领域
  9. JavaScript的常用工具汇总
  10. springmvc的配置