目前 AutoML 产品的目标数据主要有两类,一类是图像数据,一类是表数据。

图像数据

深度学习取得的最大的成功来自于图像领域,相比于传统图像分析处理做法最核心的点在于“自动”学习层次化特征,以前的图像分析都是需要人工设计很多种从原始像素提取特征的方法,需要很多专家经验,深度学习很好地解决了这个问题,使得特征可学习,将人工特征设计转变成了人工神经网络结构设计,对于图像领域的自动机器学习,很自然的一个想法就是,是否能进一步将人工神经网络结构设计里面的“人工”去掉。

谷歌、微软、第四范式等针对图像数据的 AutoML 产品的核心点是自动化图像领域的神经网络结构设计,他们针对的主要数据是图像数据。图像数据之间的相似性较大,原始输入都是像素,问题解决方案可迁移性可复用性也较大,使得 AutoML 在图像数据上相对更加容易落地。

表数据

与图像数据原始输入都是像素不同的是,表数据是抽象数据,不同的表数据之间没有很强的相似性,不同表数据各列的含义千差万别,另外表数据还跟实际业务密切相关,其中有很多时序性、概念漂移、数据包含噪声等等不同于传统机器学习的特性需要解决,因此表数据问题上 AutoML 落地的难度也会大很多,仅仅是自动神经网络结构设计是远远不够的。

目前谷歌、微软在这方面成果相对较少,MIT 的自动特征是在这类问题上一个很不错的尝试,他们主要解决的问题是数据分布在多个表中,如何自动化地将这多个表的数据转化成最终机器学习所需要的单个表数据,但是除了这个问题,实际表数据的 AutoML 落地还需要解决更多的难题。在国内,第四范式在这类问题上是最早有成熟产品落地的,比如模型自带自动化特征的线性分形分类器,自动特征组合工具 FeatureGo,自动时序树模型工具 HE-TreeNet 等等,今年也会有更多更强大的自动化机器学习产品发布。

除此之外,涂威威还补充道:对于自然语言处理中的知识自动提取等也需要自动化的机器学习技术,这是目前很多 AutoML 产品所不涉及的。

表数据比图数据更难处理相关推荐

  1. Python 将关系对数据转换为图数据 / 邻接矩阵

    1. 前言 在深度学习任务,例如推荐系统中,将关系转换为图表示,即邻接矩阵是常用的操作. 通常的做法是先将关系对数据转换为图数据,然后生成该图的邻接矩阵,再存储为稀疏矩阵.但这种方法不适用于大型矩阵的 ...

  2. 【图神经网络】图数据和图数据相关任务

    引言 本文是学习刘忠雨老师所著的<深入浅出图神经网络>过程中的笔记和记录整理,最后会有参考文献标注对应章节和内容中可能出现的参考文献.博文出处. 目录 概述 图的基本类型 图数据 同构图( ...

  3. 精美Visio架构图,数据流向图,数据抗压机制,应付领导专用

    N久之前画的Visio图,当时为了给领导展示架构设计.想来想去也只有图能比较好的表现.而自己的文笔又不行. 下载地址:http://download.csdn.net/detail/gzy11/973 ...

  4. Neo4j图数据科学及2.0版本新功能介绍

    本文转载自DataFunTalk,作者刘洋,Neo4j亚太区高级技术顾问. 导读:本文将探讨Neo4j的图数据科学平台,以及2.0版本的新功能.主要内容包括: Neo4j图数据科学(GDS)的前世今生 ...

  5. AutoML之图数据与表数据

    当前AutoML平台离"万能"还有一段距离 AutoML 成为热门技术方向,同时也面临着一些难题,这些难题有很大一方面来自于 不同数据之间解决问题手段的可迁移性 / 可复制性,解决 ...

  6. 白话大数据 | 关于图数据库,没有比这篇更通俗易懂的啦

    近年来图数据库越来越火,讨论的话题也越来越多,但很多小伙伴还不清楚图数据库到底是个啥?和传统关系型数据库有什么区别?具体又有什么特点?那今天小编将通过有个男人叫小帅的故事来给大家通俗易懂地介绍下什么是 ...

  7. 数据结构和机器学习哪个更难_如何通过更少的数据主动学习来做更多事情

    数据结构和机器学习哪个更难 If the machine learning projects are icebergs, then the parts that are underwater are ...

  8. 【SQL开发实战技巧】系列(八):聊聊如何插入数据时比约束更灵活的限制数据插入以及怎么一个insert语句同时插入多张表

    系列文章目录 [SQL开发实战技巧]系列(一):关于SQL不得不说的那些事 [SQL开发实战技巧]系列(二):简单单表查询 [SQL开发实战技巧]系列(三):SQL排序的那些事 [SQL开发实战技巧] ...

  9. 【python科研绘图】双y轴并列柱状图+折线图+数据表结合,并封装图形绘制函数

    双y轴并列柱状图+折线图+数据表结合 1. 论文原图 2 数据准备 3 代码实现步骤拆解 3.1 导入第三方库 3.2 数据赋值 3.3 数据绘图 4 函数封装 手动反爬虫: 原博地址 https:/ ...

最新文章

  1. Linux下基于Libmad库的MP3音乐播放器编写
  2. 构建scala+IDEA+sbt开发环境
  3. 蓝桥杯练习题:保留100位小数的黄金分割数
  4. 要走路~先要有一雙最舒適的鞋
  5. Python 源码剖析(一)—— vs2013 编译 python 源码
  6. python教程推荐-入门python有什么好的书籍推荐?
  7. Learning Data Structure_2_线性表、栈和队列
  8. (20)python_matplotlib解决中文乱码问题
  9. oracle用户有关操作,oracle用户会话操作
  10. excel从html文件传输乱码,打开乱码解决步骤7:在Excel中直接打开该文本文件
  11. python如何筛选数据_Python如何用filter函数筛选数据
  12. 多项式回归分析之预测成本和利润
  13. 美团一面:说说前、后端分离权限控制设计和实现思路?
  14. 华为手机长按图片无法下载
  15. php永久mediaid,幺蛾子事件之-zabbix配置告警媒介报错mediaid重复
  16. VLC模拟TS直播流
  17. NLP自然语言处理-机器学习和自然语言处理介绍(五)
  18. download 下载文件 IE兼容性处理
  19. python中占位符的使用
  20. vue2.0 实现tab标签切换效果 内容可以自行定义

热门文章

  1. 最全面的 python 字符串拼接总结(带注释版)
  2. Python中strip()、lstrip()、rstrip()用法详解
  3. python元编程详解
  4. python中如何将字符串连接在一起,多倍的字符串如何输出
  5. C语言函数与接口有什么区别?
  6. margin和padding分别适合什么场景使用?
  7. 如何在C++中调用python程序?
  8. zookeeper可视化工具zkui
  9. Java进阶之深入理解JVM类加载机制
  10. 数组和链表的区别以及应用场景