据介绍,作为阿里巴巴旗下的大数据营销平台,阿里妈妈基于自身广告业务自主研发了深度学习框架X-Deep Learning(XDL),且已经大规模部署应用在核心生产场景。

阿里妈妈表示,这也是业界首个面向高维稀疏数据场景的深度学习开源框架,突破了现有深度学习开源框架大都面向图像、语音等低维连续数据而设计的现状。

数据的高维稀疏性既是阿里妈妈业务场景的重要特征,也是互联网的众多核心应用场景(如广告/推荐/搜索等)的特征,覆盖了大多数互联网企业的数据应用模式。对于难以与BAT研发能力比肩的众多互联网公司而言,阿里妈妈表示工业级深度学习框架XDL及内置算法方案的开源,将助力各大公司的技术升级,大大提升广告/推荐/搜索场景的精准性,缩短技术迭代周期。

面向广告、推荐、搜索研发,XDL覆盖互联网最核心的场景

随着深度学习的风靡,阿里妈妈以算法先行的方式进行了探索,实验效果非常好,但很快也发现,已有的开源框架很难满足其广告场景的规模性及生产迭代要求,自研面向工业应用的分布式深度学习框架随即被提上了日程。

据介绍,新框架XDL针对阿里妈妈业务数据高维稀疏的场景特点进行了优化,性能远超当时业界众多的开源框架,自2016年下半年开始逐步部署到阿里妈妈的业务系统,至2017年初全面完成了生产化。以阿里妈妈定向广告为例,XDL框架助力了业务场景所有核心算法的深度学习创新,当年,以XDL为基础的深度学习算法升级带来的广告收入提升超过百亿。

不仅是广告场景,互联网其它的核心场景如推荐、搜索等,也具有典型的高维稀疏数据特性,例如微博、抖音、今日头条等都属于该范畴内。因此,XDL在这些场景中也具有非常高的通用性,这为开源提供了基础。不管是以广告、推荐、搜索为代表业务的企业级用户,还是对此感兴趣的个人用户,都可以加入到开源计划当中。

值得一提的是,在阿里巴巴XDL开源之前,业界的深度学习开源框架基本是面向图像、语音处理等场景数据而设计,这与整个人工智能领域的研究重点有关,图像和语音是率先取得理论突破的场景,但在工业级互联网场景中实现大突破还属首次。

此外,据机器之心了解,XDL包含三个核心组件:全异步流水线并行的分布式运行时XDL-Flow;面向稀疏数据学习的高级模型服务器AMS;本地计算引擎,插件化支持任意开源框架的Backend Engine。

开放与易用,阿里巴巴引领业界高维稀疏数据的技术标准

据阿里妈妈透露,XDL框架从设计之初,就具备了足够的开放性和易用性,开源是水到渠成的一步。

整体而言,XDL具有多项核心能力。如XDL创造性地采用了桥接的架构设计理念,重点打造面向工业级应用的分布式规模能力,单机能够处理的计算则引用现有开源框架。这种桥接的架构,使得XDL跟业界的开源社区是无缝对接的,例如用户可以非常方便地在XDL框架上应用基于Tensorflow或者Pytorch编写的最先进开源深度学习算法。此外,对于已经在使用其它开源框架的企业或者个人用户,也可以在原有系统基础上轻松进行扩展,享受XDL带来的高维稀疏数据场景下极致的分布式能力。

除了核心的XDL训练框架外,阿里妈妈透露将全面开源面向高维稀疏数据场景的系统化解决方案,计划分批次对外发布,包括面向在线实时服务的高性能深度学习预估引擎、面向全库实时检索的全新深度学习匹配引擎;同时还内置阿里妈妈自主研发的一系列创新算法,涉及CTR预估模型、CVR预估模型、匹配召回模型、模型压缩训练算法等等。

阿里妈妈“让天下没有难做的营销”的使命在近年来又多了一层含义,Ad Tech 技术驱动广告的色彩明显。阿里妈妈产品技术部资深总监盖坤表示,阿里妈妈希望通过技术开源来赋能大家,引领业界高维稀疏数据计算的技术标准,推动整个领域技术的整体前进,让创新的算法、框架方案层出不穷。

原文发布时间为:2018-11-28

本文作者:李亚洲

本文来自云栖社区合作伙伴“机器之心”,了解相关信息可以关注“机器之心”。

面向高维稀疏数据场景,阿里妈妈宣布开源XDL深度学习框架相关推荐

  1. 35 万行代码,旷视重磅开源天元深度学习框架 ,四大特性实现简单开发

    [导读]2020 年 3 月 25 日,人工智能企业旷视科技举办线上发布会,旷视联合创始人兼 CTO 唐文斌宣布正式开源其 AI 生产力平台 Brain++ 的核心组件--天元(MegEngine). ...

  2. MindSpore!这款刚刚开源的深度学习框架我爱了!

    犹记得今年的华为开发者大会 HDC 2020 上,一直受人瞩目的深度学习框架 MindSpore 终于开源了. 我之前一直关注 MindSpore,还是挺期待的.MindSpore 是一款支持端.边. ...

  3. 化学人学python有前途吗-Java之父点赞的开源Java深度学习框架,你不学下吗?

    深度学习领域中有很多面向Python开发者的资源与教程,比如使用NumPy进行数据分析.使用MatPlotlib进行可视化等:深度学习框架方面,TensorFlow.PyTorch.MXNet等常用框 ...

  4. 百度开源的深度学习框架,飞浆最新版来啦!来瞅瞅吧!

    11月5日,"WAVE SUMMIT+"2019深度学习开发者秋季峰会在北京召开,飞桨(PaddlePaddle)全新版本发布,进行了21个产品方向的重要升级,王老湿在这里给大家做 ...

  5. 微软和谷歌分别开源分布式深度学习框架,各自厉害在哪?

    微软和谷歌一直在积极研究用于训练深度神经网络的新框架,并且在最近将各自的成果开源--微软的PipeDream和谷歌的GPipe. 原则上看,他们都遵循了类似的原则来训练深度学习模型.这两个项目已在各自 ...

  6. 华为开源的深度学习框架 MindSpore

    点击蓝字关注我们 扫码关注我们 公众号 : 计算机视觉战队 扫码回复:华为开源,获取下载链接 作者:杨军 来源:知乎 纯技术讨论,不涉及其他,部分我拿不准的地方,会直接以(?)标识出来,欢迎菊花厂同学 ...

  7. AI + 3D!英伟达开源3D深度学习框架Kaolin

    点击我爱计算机视觉标星,更快获取CVML新技术 3D计算机视觉在医学影像.自动驾驶.机器人深度感知.视频游戏.虚拟和增强现实中有重要应用. 近日,英伟达新开源了kaolin深度学习框架,旨在加速3D计 ...

  8. 阿里开源首个深度学习框架 X-Deep Learning!

    刚刚,阿里妈妈正式对外发布了X-Deep Learning(下文简称XDL)的开源代码地址,开发者们可以在Github上自主下载. 此前,在11月底,阿里妈妈就公布了这项开源计划,引来了业界的广泛关注 ...

  9. 刚刚,阿里开源首个深度学习框架 X-Deep Learning!...

    前言: 刚刚,阿里妈妈正式对外发布了X-Deep Learning(下文简称XDL)的开源代码地址,开发者们可以在Github上自主下载. 此前,在11月底,阿里妈妈就公布了这项开源计划,引来了业界的 ...

最新文章

  1. 有没有记录程序运行中所有的函数调用堆栈的工具?
  2. linux网卡team0,Linux双网卡绑定单个IP之(team)
  3. QPW 用户签署协议日志表(tf_user_agreement_log)
  4. mongoose 数据库设计千万要注意 Cast to [number] failed for value
  5. win7下安装TensorFlow
  6. 微信小程序周报(第十一期)-极乐商店出品
  7. 80端口未被占用,无法启动wamp的解决方法(原创)
  8. 问你觉得iOS7为什么要扁平化,扁平化和之前的比有什么优势
  9. Open3D+vs配置以及使用教程
  10. Windows 最值得推荐的装机必备“神器”软件大合集
  11. 乐优商城项目实战系列2
  12. 终端一直显示 (master) ,即终端一直处于master分支下的取消办法
  13. 重复渐变过渡 百分比
  14. 简单正则^(?![^a-zA-Z]+$)(?!\D+$)[0-9a-zA-Z]{6,35}$
  15. HTTP/2 协议规范
  16. 1419D2 Sage‘s Birthday
  17. VLC保存网络视频及抓包合成视频
  18. python简单游戏——打气球
  19. 【资源下载】敬勇 - 一条执行时间小于1秒的 SQL 引发的性能问题
  20. linux关闭硬盘检测,关闭Linux开机强制检测硬盘

热门文章

  1. 最新多用途的APP软件业务介绍官网模板源码
  2. 几种关于用python的for循环求1到10的立方的方法
  3. Solaris IPMP两种配置方法
  4. EventBus使用详解
  5. 三个堪称神器,却很少人使用的手机软件
  6. 梆梆安全加固企业版分析
  7. Huffman编码/译码问题
  8. unity3d加载外部图片
  9. RFI\RFP\RFQ的区别
  10. 2021.5.13 易协同访客数据