摘要:随着数据量的指数级增加和规则型数据类型的限制,深度学习的业务场景拓展变得更加困难。图神经网络能够做出更精准的预测,为每一位用户提供不同的个性化服务,实现精准化营销,这也是如今互联网企业进行二次转型的技术突破口。

在每年诸如618大促这样的线上购物节中,一个个性化且精准的营销推广于电商平台来说如虎添翼,所以如何在海量的商品中为消费者挑选出他们最有可能购买的产品,成为不少电商平台技术发力的重点。而这背后必不可少的便是AI。

深度学习作为一个相对成熟的AI技术,在过去作为互联网红利的出口被广泛应用在工业级生产和企业的发展中,但随着数据量的指数级增加和规则型数据类型的限制,深度学习的业务场景拓展变得更加困难。

于是,市场开始将目光放在了图神经网络(GNN)技术上。图神经网络能够做出更精准的预测,为每一位用户提供不同的个性化服务,实现精准化营销,这也是如今互联网企业进行二次转型的技术突破口。

当前,华为云图神经网络借助ModelArts的高效神经网络训练优势,正在大幅度提高总体计算效率,让商品推荐在内的图神经网络应用更为成熟。

图神经网络的行业应用

当前的主流深度学习还是CNN、RNN等技术(对应图像识别、文本挖掘等领域)。但传统深度学习技术(CNN、RNN)并不能有效的处理结构数据,如金融领域、基因蛋白质网络、社交网络、商品推荐等。如果深度学习想要拓展到更多的关系场景,在图数据上的高阶学习采用图神经网络(GNN)技术将会取得更佳的效果。

以知识图谱为例,其作为图神经网络的应用比起技术本身它的场景更为人所熟知。生活中有很多场景都有知识图谱的身影,如语义搜索引擎、智能客服、生活小助手等。由图神经网络构建的知识图谱可以提供视频/直播字幕、内容审核、智能客服、保险赔付、医疗图谱、知识消岐等服务。借助知识图谱还可以将专属的行业知识定制成图网络,为行业信息进行分析,帮助企业进行转型升级。

未来,人工智能的运作将会更加接近人脑,图神经网络的出现使人工智能开始理解世界,认识世界,而不再只是进行统计拟合。如何让图深度学习充分挖掘其应用价值实现高维稀疏数据的应用场景落地,将是在接下来的十年中,同质化的企业进行重新洗牌的关键。

ModelArts2.0标志华为云图神经网络落地

在去年的华为云全联接大会上,华为云重磅发布一站式AI开发管理平台ModelArts2.0。宣布华为云在图深度学习领域做出突破,华为云图神经网络正式落地。

此次ModelArts2.0发布的十余项新特性及服务,包含智能数据筛选、智能数据标注、智能数据分析、多元模型自动搜索、ModelArts SDK、图神经网络、强化学习、模型评估/诊断、模型压缩/转换、自动难例发现、在线学习等,覆盖了AI模型的全生命周期。可以看得出来,华为云ModelArts在下一盘很大的棋,图神经网络的落地是ModelArts在深度学习领域实现因果推理的一次突破,也是实现自动化AI能力必不可少的一环。

华为云图神经网络是GES图引擎与ModelArts联手打造的新型图神经网络技术,通过采用分布式图计算平台和深度学习计算平台并行的方式构建新的架构以此来实现大规模图神经网络分析能力。

华为云图神经网络的架构师表示华为云图神经网络(GNN)框架设计原则是:职责分明,架构归一。对单个算法,将数据预处理、领域采样等稀疏处理操作下压到图引擎;深度学习层则专注于算子的优化,多种GNN算法框架统一化,复用统一的算子。

分布式图计算平台进行大规模图网络处理

企业级图深度学习的计算中,图的规模将会根据业务需求达到百亿甚至千亿的规模,因此,一个成熟的图深度学习将会把超大规模的图网络的计算交给独立的分布式图计算平台。

当前大部分图神经网络框架都是在处理静态图,这是由于大多数框架是把图神经网络算法当做离线计算任务来对待的,离线计算的数据是不变的(静态),对于每次计算,都需要将完整数据加载一遍,因此不适合处理动态图。但是图数据本身却往往是变化的(动态),算法在运行过程中需要不断的对图进行遍历,然后将图数据从内存中调用给深度学习进行建模,然后还要在建模过程中进行不断的回传,这个问题在小图上不是很明显,但是在亿级图网络中,就会变成严重的性能问题,并且遍历的时间将会呈指数级上升,甚至造成宕机。

华为在动态图方面的主张是,采用自研GES图引擎来维护图数据,保证数据可以动态增删改。同时在一份数据上,执行多种不同的算法,无需重复加载数据;尤其是对于大规模图来说,能明显节省端到端时间。目前动态图的处理仍有可优化的地方,比如动态图上的数据更改可以当做是增量数据,最佳做法是设计增量算法来对增量数据进行分析,而不是对全量数据进行邻域采样、随机游走、求梯度等操作。对于增量的图神经网络算法的研究还比较前沿,尚未形成完备理论。

GES图引擎目前拥有20多种图场景算法和大量的图优化算法,性能上能将亿级图查询在秒级计算完成。在图算法上GES图引擎根据工业和企业需求,集成实现PageRank等二十多种常用算法,应用场景覆盖城市工业生产、管道监控、商品推荐、社交推荐、项目分析、企业洞察、知识图谱、金融风险管控、企业IT应用、关系挖掘等多项领域,并支持点查、边查、属性过滤等基本查询将查询存储等功能。

以Pixie算法为例,Pixie算法是华为云尝试了将多元数据构建到同一张图,并在这个异构图上配置相应的schema、点边属性、权重而设计的算法。Pixie算法是一种全新的实时推荐算法,克服了异构图的数据获取和融合问题,支持多请求节点下综合推荐,能满足各种复合型、时变、多样性推荐场景需求;大数据量下,无需预先训练模型,就能适应数据的动态变化,达到较好的实时推荐效果,可扩展性很强。

新框架解决图算法与深度学习的高频交互难题

基于原生图引擎提升数据处理的效率和统一的算法框架,是当前图神经网络平台研发的重难点,而图数据的遍历以及与深度学习的交互会导致图的运算效率大大降低,这也是图深度学习一直无法落地的瓶颈之一。

因此,如果图深度学习想要在性能上有所突破就需要重新设计一个新的GNN框架,以下是AI前线授权得到的华为云图神经网络框架图。

图:基于图引擎的GNN新框架

(1)基于图引擎的GNN新框架:在ModelArts中的高效神经网络训练算子的基础上,结合GES既有的高性能图计算框架平台能力,利用图引擎高并发、低延时的特点,将GNN的训练过程高度并行化,如将边上的跳转概率估计、顶点邻域采样、负样本构建等等,都化解为每个顶点的局部操作;系统提供了动态调度器,让这些局部操作可高度并行化执行,就能极大提升系统的总体吞吐量。

(2)多种GNN算法框架统一化:使用统一架构实现了非监督的大规模图嵌入(例如DeepWalk, Node2Vec)和半监督的图卷积(例如GCN, GraphSage)等多类GNN算法,降低了系统的维护成本。

图:基于统一GNN架构的图嵌入与图卷积计算示意

(3)GNN与图数据管理一体化:企业级GNN应用通常都不会是一次性计算,而且数据规模也很大,因此这些数据必须要被维护和管理起来。而现有的GNN通常不具这样的考量,用户只能另建数据库维护,计算的时候再把数据整体导出。不仅资源消耗大,也引入数据一致性等诸多问题。而GES采用属性图数据模型(Property Graph)和生态兼容的事实标准Gremlin图查询语言进行分布式图数据管理和维护,需要训练的时候则在图引擎内本地调用(in situ)各类算子,并发执行,降低了端到端的性能损耗。

研发人员在相同平台上对比了本产品与多个开源版本在数据预处理、各类采样方式下的实验表现(来自华为云内部数据):

图: (上)相同平台上与开源版本在数据预处理、各类采样方式下的性能对比;(下)系统可扩展性测试结果

华为云图神经网络借助ModelArts的高效神经网络训练优势,以及GES的高性能图计算优势,大幅度提升了GNN的总体计算效率,以node2vec算法为例,在PPI数据集上,华为云图神经网络从采样到训练可在2min内完成,较传统开源实现提升20倍。

精度和资源的权衡

在图神经网络模型的精度方面,华为云图神经网络通过设置参数调节模型精度,并使用CPU或者GPU来训练图神经网络算法。

由于图数据的特殊性,通常情况下,对于大多数类型的数据,CPU训练的性能和效果并不逊于GPU。同时针对图嵌入和图卷积两大类算法,华为云图神经网络采用了不同的优化方式来降低资源占用率,提高计算性能,图嵌入类算法利用并行加速和存储设计进行正采样和负采样的优化;图卷积部分则由于其复杂度高的是layer和layer之间的数学变化,着重优化加速矩阵。华为云方面在未来还会考虑基于自己的人工智能芯片从混合硬件架构进一步提升图神经网络的计算性能。

华为云图神经网络模型的生命周期管理则依托华为云一站式AI开发管理平台ModelArts,训练的模型可以一键部署,且整个数据-算法-模型-推理的生命周期可以通过平台提供的溯源图查看。

目前,业界要实现大规模的图神经网络应用还需要一段时间,但华为云图神经网络的落地为后续开发者提供了可供参考的理论经验和社交,金融,基因,图像语义等多关系场景的实践基础,目前华为云图神经网络已在全球机器学习与数据挖掘类学术会议上发表多篇论文,并获得2019中国人工智能峰会“紫金龙蟠奖”。

结语

图神经网络是人工智能实现真正智能化的一步,也是人工智能开始解决深度学习难以处理的关系数据的开端。从现在开始人工智能够认识并学习世界的复杂关系,相信接下来它会以更多姿态出现在我们的生活中,最直观的便是当下的各种线上电商购物大促中。

华为云618大促,AI开发平台ModelArts也为用户准备了1折套餐包,对图神经网络或者对AI开发有兴趣的同学,大家冲鸭!

点击这里,了解更多精彩内容

精准营销还能这么玩,看企业圈圈画画搞定GNN相关推荐

  1. 【企业分析】搞定设计公司

    [企业分析]搞定设计公司 前言 缘由: 11月6号研招网需要网上确认,要提交证件照等材料.经同学介绍,使用了一下搞定设计,发现满足需要,可以在线抠图生成证件照. 虽然我自己也可以用PS处理,但是我平时 ...

  2. 快速搭建营销型网站,程序小白也能轻松搞定

    快速搭建营销型网站,程序小白也能轻松搞定 近些年,互联网进入高速发展阶段,人们的生活处处离不开网络,网络的重要性由此可见.如果企业仍然处于传统的营销模式,显然是不行的.在这个数据时代,网站建设对于企业 ...

  3. 微信好友互删服务器还会有记录吗,微信好友互删后还能恢复吗?一招轻松搞定...

    一.共同好友法 找共同好友或者都认识的朋友在推荐一下名片就可以了;如果没有就点击微信通讯录最上方,点击新的朋友,上面会有你们当初通过什么方式加的微信好友,在重新加回来即可. 二.直接在手机上使用卓师兄 ...

  4. 世界杯法国夺冠 华帝真的全额退款了 营销还可以这么玩!

    前段时间,朋友圈和各种社交平台都被华帝的一波营销刷屏,只要世界杯法国队夺冠,就会给消费者全额退款其在2018年6月1日到7月4日之间购买的夺冠套餐,据统计,在这个活动期间,华帝的线下线上零售额都有了2 ...

  5. 挖掘城市ip_抖in杭州嘉年华,原来城市营销还能这么玩!

    作者 | 汤木森 来源 | TOP营销(ID:TOP_MKT) 在<看不见的城市>中,卡尔维诺曾写下这样的语句:"每到一个新城市,旅行者就会发现一段自己未曾经历的过去." ...

  6. 杨幂掐点祝福唐嫣,打破不和传言,情感营销还能这么玩?

    发现今天的蜂蜜泡水特别地甜,舍友说,同样地蜂蜜同样多的水泡出来的水有什么不一样,肯定是你心情变好了.说得好像也有道理,想想最近这么多甜蜜的事,一开始是颖宝结婚,不久唐嫣和罗晋也宣布结婚,可不真是甜歪了 ...

  7. 企业数据分析,搞定这3个重点事半功倍!

    近年来,人们对信息的关注已不仅限于数据本身,而是通过一系列统计工具及分析手段去挖掘其背后隐藏的价值,从而带来诸如减人增效.辅助决策的效果. 传统的电子电气制造业是典型的人口密集型生产行业,企业转型离不 ...

  8. 给我10张画,我能还你1万张|Adobe团队搞定小样本图像生成

    丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI 假如一位大师画了一些画,但是只有10幅,有没有可能利用这仅有的10幅训练出一个模型,产生N幅同样风格的作品来呢? 从目前的图像生成模型来看, ...

  9. 【已解决】macbook软件卸载了图标还在launchpad上怎么办?一分钟搞定!

    问题描述 有时候,我们使用MacBook时没有从Apple Store安装软件,而是从一些非官方渠道安装的软件. 这样我们将这些macbook软件卸载了之后,图标还会留在在launchpad(启动台) ...

最新文章

  1. 在Windows下搭建Android开发环境及遇到的问题
  2. java新手笔记1 Hello World!
  3. RecyclerView缓存机制(回收些啥?)
  4. python数据科学-数据预处理
  5. CSS预处理——LESS
  6. 获取iOS任意线程调用堆栈(五)完整实现:BSBacktraceLogger
  7. 我只注视你全cg存档_在暴戾的他怀里撒个娇 作者:春风榴火全娱乐圈都在等我们离婚作者:魔安...
  8. MySQL之父Michael Wideneus:有自己的电脑,我可以做任何事情
  9. 沟通CTBS V5.0发布, 南北通及安全性成最大亮点
  10. 网络编程聊天室----服务器端
  11. hadoop入门手册5:Hadoop【2.7.1】初级入门之命令:文件系统shell2
  12. 数据分析师面试题攻略
  13. php后缀名隐藏,php怎样隐藏后缀名
  14. 小甲鱼老师目前所有视频教程下载地址
  15. 高等数学——变限积分求导
  16. 【kali】一款黑客们都在使用的操作系统
  17. 终于搞定微信小程序canvas分享海报
  18. 1258:数字金字塔
  19. 如何快速高效出高质量效果图
  20. python苹果下载软件_PythonforMac官方下载_PythonforMac最新版_PythonforMac3.6.4官方最新版-华军软件园...

热门文章

  1. es6 Object.getOwnPropertyDescriptors()
  2. matlab里有java数据库吗_Matlab通过JDBC建立到Oracle数据库的连接
  3. 看完这篇,你的老电脑能够快到起飞再也不卡!
  4. ubuntu 上NVIDIA驱动和CUDA9.0 的坑之一二
  5. 【codeforces 799A】Carrot Cakes
  6. 通过Oracle VM Manager管理配置虚拟机
  7. 让其他CMS黯然失色的we7CMS
  8. linux 线程池编程,Linux-C-9-线程池编程
  9. 对linux的CFS调度算法的理解
  10. PAT乙级(1027 打印沙漏)