事情是这样的...

前不久,小夕注意到了一份来自权威评测机构IDC发布的《2020年下半年深度学习平台市场份额报告》:

▲IDC:2020年中国深度学习平台市场综合份额top 5

立刻惊了!印象里百度飞桨三年前还只是一个低调、小而美的深度学习框架,如今咋一跃成为中国市场份额第二的深度学习平台了呢??

2019年排在第三:

▲IDC:2019年中国深度学习平台市场综合份额top 6

当时的小夕一度觉得前面的Tensorflow和Pytorch两座大山虽然各有利弊,但也都着实能打,一时半会很难有第三者插足两者的竞争。

万万没想到的是,仅仅一年的时间,百度飞桨就超越了Facebook成为市场份额第二的深度学习平台,这简直比当年Pytorch吞食Tensorflow的市场份额还要疯狂。

回想一下,Pytorch当年为什么能在短时间内迅速从Tensorflow口中夺食并与之分庭抗礼?

一种流行的说法是“因为Pytorch选对了动态图,在易用性上强刺了Tensorflow一刀。”

小夕倒觉得这仅仅是表面。听起来Pytorch的成功有很大运气成分,但“选对了动态图”、“API简洁好用”、“debug真舒服”的背后,围绕的关键词都是“门槛”,或者往大的方面讲,叫“用户体验”。

ps: 真的不要以为程序员一个个都是追求“黑框”、“复古”,有受虐倾向的“极客”。在深度学习平台产品问题上,请把他们定义为“用户”。

追求极致的用户体验和无限下沉的使用门槛,放在任何一个产品里都是不过时的,深度学习平台也是一样。

那百度飞桨又是做对了什么?

“多机多卡训练简直不要太好用!”
“部署太容易了~”
“能训超大规模模型。。。”
“超多免费课程、直播、教程、文档资料...”
“难以想象深度学习可以不写代码...”
“从AI想法到实际应用的最快速度,没有之一”
...

与前面Pytorch一样,这些表象的背后,依然紧紧围绕着“门槛下沉”、“用户体验”。单独的每一点都不足以支撑百度飞桨弯道超车,但这些点连成线、铺成面后,所制造的能量远远不低于Pytorch凭借动态图带来的用户体验革新。

用一句话说,Pytorch和飞桨都革新了用户体验,前者靠的是动态图一针见血,后者则是全产品线围绕用户体验全面革新。

贴一张飞桨的全景图:

关注小屋的大都是专业的AI开发者,飞桨在大家的印象里就是个深度学习框架。实际上,飞桨如今已经构建起了自己的产品全景图,相比Pytorch而言,飞桨已经将门槛从专业的AI开发者下沉到了业余从业者、普通的AI爱好者、甚至中小学生群体!

对这些群体而言,即使是动态图功成名就的Pytorch,对他们来说也用起来太痛苦、门槛太高了。可以说,从pip install pytorch到看得见摸得着的AI应用,也就差了一本高数教材、一门线性代数、一门概率统计、一门数据结构与算法、一门python和一门C++、一门机器学习、一门优化理论、一门深度学习、一个3天入门计算机视觉和72小时入门自然语言处理的培训班了。

让飞桨完成这一轮用户体验革新的,首先是一个全新蜕变的 high-level 深度学习框架。飞桨框架不仅面向专业开发者,而且还囊括了大众使用者,这背后离不开其中的high-level设计理念。此外,CV、NLP模型库,端到端的开发套件,企业版AI开发平台以及今年5月20号新发布的框架V2.1版“动静统一”特性,多端多平台推理部署工具链等,均围绕用户体验展开升级,这也成为了飞桨份额在国内一举超越的关键点。

high-level的深度学习框架

实现强化学习?实现多任务学习?实现神经架构搜索?联邦学习?图神经网络?

每一项深度学习前沿、热门话题若使用深度学习框架的底层算子实现,均有极其庞大的代码量,且很容易出错,从头手撸对绝大多数开发者而言很不现实,只能到处复制粘贴啃开源磨原理。

哪怕是Tensorflow中内置Keras这种操作,也仅仅是将op的操作粒度提升至layer level,对于诸如强化学习这种较为复杂的上层应用,一般不得不去借助第三方high-level框架。

然而,对飞桨用户来说,哪怕是初级的AI开发者,甚至是业余的AI爱好者,都可以轻松玩遍这些热门话题!靠的就是一套基于飞桨框架封装而成的high-level框架,或者说一套工具组件。

比如神经架构搜索有AutoDL、强化学习有PARL、多任务学习有PALM、联邦学习有PaddleFL、图神经网络有PGL...甚至还有听名字就很高大上的量子机器学习框架Paddle Quantum和生物计算框架PaddleHelix!

而在深度学习热门应用的计算机视觉、NLP等方面更是有官方开源的模型库和端到端的开发套件,High-level的开发模式体验过后就再也回不去加减乘除矩阵计算了!

还能更上一层?

除了深度学习框架自身的蜕变外,还有更加high-level、在非专业开发者群体中耳熟能详的名字——EasyDL,以及全面刷新AI算法工程师开发体验的 BML

EasyDL

EasyDL可以看作是真正零门槛的深度学习high-level开发平台,无论是传统行业的企业用户、非科班出身的AI爱好者乃至无编程经验的中学生,都能通过EasyDL平台体验到将想法变成AI应用的顺畅感。

在EasyDL里,只要通过拖拽页面、鼠标点击、上传少量数据,就能快速定制一个深度学习模型。支持图像分类、物体检测、图像分割、文本分类、文本匹配、情感分析、实体抽取、语音识别等各类计算机视觉、自然语言处理和语音处理领域经典任务,如图所示:

在最繁琐的数据处理环节,EasyDL内置了智能数据服务EasyData,不仅在业界首个开放软硬一体端云采集方案,还支持智能标注与多人标注双管齐下,标注效率提升80%,并且在训练过程还支持自动数据增强,助力模型效果进一步提升。

而在模型设计、训练、评估等过程,完全无需代码,可以直接在网页中配置模型训练相关信息:

训练完成后,更是可以直接将模型“一键”部署到云端,获取云端调用的服务接口,或者打包为适配多种智能设备终端的离线SDK,让你训练的模型变成看得见摸得着的实际应用。

详细流程这里就不展开讲啦,感兴趣的小伙伴可以参考链接进行实践:
https://ai.baidu.com/ai-doc/EASYDL/3kccwnvy6

在飞桨的全景图中,与EasyDL类似的high-level的平台还有 BML全功能AI开发平台

BML

如果说EasyDL是为了把门槛降低到0,那么BML就是把门槛稍作提升的同时,大大提升操作的专业度、灵活性和功能的丰富度。前者可以类比为windows自带的画图工具,而后者则可以认为是Photoshop这种更为专业的开发工具。而无论EasyDL还是BML,都为开发者屏蔽了大量的深度学习框架层的技术细节,使得开发者可以更加专注在AI应用的开发,而不是繁琐的代码和底层原理细节里。

如图所示,BML与云端打通,可以按需使用云端计算资源,体验多机多卡分布式训练的快感。而在模型开发最为繁重的数据处理环节,BML同样内置了EasyData,极大的提升了数据处理与标注的效率,间接提升模型效果。

在最关乎应用效果的模型方面,BML则预置了百度超大规模视觉预训练模型、NLP预训练模型ERNIE 和若干帮助模型效果提升的微调技巧,同步支持PaddlePaddle、Tensorflow、Pytorch进行模型自定义。为了帮助专业开发者进行更好的二次开发和专业定制,BML还提供了全面超越原生Jupyter Notebook的云端开发环境。模型训练ready后,更是支持云服务部署、多平台多语言的本地服务器部署、设备端SDK部署等,打通模型到应用落地的最后一公里。

当然了,进阶一些的开发者也有模型定制化和深入理解的需求,BML中可以直接可视化到模型的网络结构,看到模型属性、节点信息、节点输入输出等专业信息。可以说将门槛下降到了极致的同时,还保留了专业性和灵活性。

▲BML中,一键可视化模型网络结构

这里给出BML的实践传送门,感兴趣的小伙伴可以自行体验:
https://ai.baidu.com/ai-doc/BML/Zkorya4bd

总之,BML与EasyDL一起满足着不同用户的需要,让深度学习不再是科班出身硕士博士的专利,成功打破壁垒,让深度学习、人工智能真正走进大众视野。深度学习框架层面,更是打破了专业开发的天花板,使得强化学习、多任务学习乃至前沿的量子计算、生物计算以一种high-level的方式展现给专业的开发者,使得复杂技术的研发也从此变得容易,使得专业开发者也能在不牺牲专业性和开发灵活性的同时,节约大量的开发成本。

在不久前的WAVE SUMMIT2021上,飞桨发布开源框架V2.1,包含了一系列的新发布和升级。

比如说升级了自定义算子功能,封装更简洁、训练和推理全打通、一键编译、安装并生成算子API,这些都让开发者能更专注于算子计算的本质,减少编写自定义算子的精力。分布式训练方面,发布大规模图检索引擎,能支持万亿边的图存储和检索。模型套件方面,文心ERNIE新开源发布 4大预训练模型,不光能理解语言,还可以理解图像,实现统一的跨模态语义理解。另外就是在部署上,提供了全面的推理部署工具链,还将百度自身 AI 技术的实践经验,做成了一张推理部署导航图供人参考,涵盖了 300 多条经过充分验证的部署通路!实打实的帮开发者打通AI应用的“最后一公里”。

开发上便捷灵活+应用上普适多元,飞桨一步步创造领先同行的深度学习开源能力。飞桨这一波弯道超车,可以说下足了功夫,为下一代深度学习平台打开了新的窗户。期待它登顶的那一天!

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

百度飞桨弯道超车了吗?!相关推荐

  1. 百度飞桨、郑州大学联合培养AI工程人才,破解无纺布瑕疵检测难题

    1平方毫米有多大?圆珠笔尖大小.这么小的一个点要是放在高速运转每分钟几十米的布匹上,要检测出来的难度可想而知.而针对以无纺布为原材料的口罩,无纺布的质量要求容不得一点瑕疵,因此瑕疵检测成为行业里的一个 ...

  2. 【组队学习】【34期】百度飞桨AI达人创造营

    百度飞桨AI达人创造营 航路开辟者:百度飞桨 领航员:六一 航海士:阿水.颜鑫.宋泽山.刘洋.张文恺 基本信息 内容属性:合作课程 练习平台:https://aistudio.baidu.com/ai ...

  3. 百度飞桨成为北京市首个AI产业方向创新应用平台

    1月20日,北京市经济和信息化局正式授予百度公司"北京市人工智能产业创新应用平台(百度飞桨)".当前,北京市正在创建国家人工智能创新应用先导区,人工智能作为新科技革命和产业变革前沿 ...

  4. 百度飞桨全新升级:重磅推出PaddleHelix平台、开源框架V2.0RC,硬件生态路线图全公开...

    12月20日,WAVE SUMMIT+2020深度学习开发者峰会在北京举办.本届峰会,百度飞桨带来八大全新发布与升级,有支持前沿技术探索和应用的生物计算平台PaddleHelix螺旋桨,开发更加便捷的 ...

  5. 支持量子机器学习,王海峰发布最新百度飞桨全景图

    出品 | AI科技大本营(ID:rgznai100) 刚刚,WAVE SUMMIT 2020深度学习开发者峰会上,百度CTO王海峰开场即披露了一组飞桨数据:飞桨累计开发者数量已超过190万,服务企业数 ...

  6. 2021语言与智能技术竞赛上线!百度飞桨提供平台算力支持

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale竞赛 主办方:中国计算机学会.中国中文信息学会 人工智能是让机器像人一样感知和 ...

  7. 精度45.9%,推理速度72.9FPS,百度飞桨推出工业级目标检测模型 PP-YOLO

    允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 工业视觉.自动驾驶.安防.新零售等我们身边熟知的各行各业都需要目标检测技术,由于其很好的平衡了标注成本.检测精度和速度等,成为当前智能制造产 ...

  8. 百度飞桨入选互联网领先科技成果,王海峰:AI进入工业化大生产新阶段

    2019-10-20 19:40:17 获悉,百度飞桨深度学习平台入选 "世界互联网领先科技成果",这是继百度大脑.小度助手(DuerOS).Apollo之后,百度在乌镇世界互联网 ...

  9. 飞桨模型保存_重磅发布开源框架、生物计算平台螺旋桨,百度飞桨交了年终成绩单...

    机器之心报道 作者:蛋酱.张倩 在 12 月 20 日举行的「WAVE SUMMIT+ 2020 深度学习开发者峰会」上,飞桨平台交出了一份非常亮眼的年终成绩单. 2020 年,是不平凡的一年:这一年 ...

最新文章

  1. 在遗传算法中出现等式约束_排序算法中的稳定性-等式的处理
  2. (流式、lambda、触发器)实时处理大比拼 - 物联网(IoT)\金融,时序处理最佳实践
  3. 邮件服务器软件EwoMail 1.05 发布
  4. 2016: C语言实验——打印金字塔
  5. 牛客国庆集训派对Day3: I. Metropolis(dijkstra)
  6. 3.2配置自定义的路径映射
  7. 罗技Ghub配置文件压枪编程——仅供学习
  8. 红外夜视摄像头 蒂卡尔K-TF使用手记 2
  9. Android WIFI功能——WifiManager
  10. 关于试用期的四大认知误区,千万别被渣公司坑了!
  11. 前端必会的 HTML+CSS 常用技巧 之 虚线的实现方式
  12. 带你全面解析Android框架体系架构view篇,全网疯传
  13. 看看我们熟知的17个行业如何被互联网所颠覆
  14. linux进程时钟时间,Linux的时钟
  15. 史上最全的sqlserver运维分析工具,汇总都在这里了,适合sqlserver的dba人员
  16. Android环境配置时遇到问题及解决方案
  17. ISP嵌入式平台/成像sensor
  18. modbusCRC 、CRC-CCITT(0xFFFF) 校验
  19. matlab 编写程序,matlab语言编写程序
  20. 清华计算机考研csp,「考研2021」400分跨考清华大学软件学院经验帖

热门文章

  1. 6、使用infowindow
  2. 理解zookeeper选举机制
  3. A star算法优化二
  4. 人工智能在语音和数字图像处理领域有哪些具体化应用_智能呼叫中心系统有哪些优势...
  5. 单链表的应用(电话本)
  6. 图像分类_03分类器及损失:线性分类+ SVM损失+Softmax 分类+交叉熵损失
  7. logistic模型原理与推导过程分析(3)
  8. mysql与缓存脏读_MySQL 事务的隔离级别问题 之 脏读
  9. Web框架——Flask系列之模板使用练习(六)
  10. JavaScript + Audio API自制简易音乐播放器(详细完整版、小白都能看懂)