梦晨 鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

百度和央视又联手在直播现场上演黑科技了。

百度CTO王海峰只说了一句话,就给主持人整出了个数字“孪生兄弟”。

更厉害的是,这位数字人刚一出生,开口就有“北大还行”内味儿了(手动狗头)。

这还没完,现场,中国火星探测工程和百度联合培养的火星车数字人祝融号也跟全国人民见了面。

一登场,就落落大方地与主持人谈笑风生了起来,各种“保送”、“火星种土豆”的梗那叫一个信手拈来。

谈到兴起处,还能即兴赋诗,引得主持人直呼“看给你厉害的”。

这就是百度世界大会直播现场,百度在台前贡献的又一科技盛宴。

而说起这场直播的高光时刻,可不仅仅是数字人,还有汽车机器人、昆仑芯2、小度智能巨屏电视等等一众新品、亮点。

当然,精彩纷呈的背后,一直是有技术底座为支撑的。并且,作为一家深耕AI技术十余年的公司,百度透过百度世界大会展现的深层布局和最新技术洞察,往往更值得关注。

百度大脑升级7.0:融合创新、降低门槛

比如,这一次跟主持人唠得有来有回的数字人背后,其实就是百度大脑的全新能力在做支撑。

王海峰介绍,这一百度AI核心技术引擎,如今已正式升级到7.0。

所谓“升级”,不仅有表面上功能的添加和性能的增强,更是瞄准了王海峰此前判断的AI行业发展两大趋势——融合创新降低门槛

为什么说融合创新是AI发展的趋势?

在人工智能进入工业化大生产阶段的今天,某个具体技术上的单点突破固然是好事,能发论文、刷榜单、评奖项。但要想真正走入工业实践、落地应用,不靠多种技术的融合已经行不通了。

王海峰针对这种现象指出了4个具体融合方向:

  • 知识与深度学习融合

  • 跨模态多技术融合

  • 技术与场景融合

  • 软件与硬件融合

原因具体对应着AI发展到今天,从技术到应用上的4个现状。

第一个现状,AI这几年确实做到了大力出奇迹,但大力背后要付出高昂的代价。

千亿级参数的GPT-3在语言能力上的表现惊艳了世界一次,训练一次约消耗19万度电的成本又惊吓了世界一次,基于如此高成本技术开发出来的AI应用又有多少企业用的起?

于是在GPT-3之后语言模型的发展分成了两条路线。

一条继续在规模上加码,以谷歌的Switch Transformer为代表,一举把参数规模怼到万亿级

另一条,就是百度大脑7.0的知识与深度学习与融合,尝试让AI在大规模计算之外掌握更多常识。

百度大脑7.0发布的知识增强大模型,靠引入大规模知识图谱,只用百亿级参数规模就在语言模型权威测评SuperGlue上登顶全球榜首,超越人类水平0.8个百分点。

百度能不依赖大力出奇迹而是转而依靠知识,还有个得天独厚的优势:它更懂中文,拥有全球最大的异构知识图谱。

于是除了在国际榜单登顶,这一知识增强大模型还一举刷新了54个中文 NLP任务基准。

学到了“撒贝宁是主持人”和“火星上没发现水”这样的知识,祝融号数字人才能在大会现场准确答题、流畅对话。

有这样能力的百度大脑7.0,成本更低,能力更强、更贴近市场,才能真正开始谈大规模落地。

第二个现状,AI要落地不能仅停留在幕后提供一些碎片性的技术支持,而是要更多开始和人类直接互动。

要想和人打交道,理解和生成文本只是一个方面。要看、要听、要把话说给人听,这就需要融合文本、语音、图像多模态的技术。

在直播上展示的“一句话生成数字人形象”,就是百度大脑7.0跨模态多技术融合的一次精彩演示。

先要听取指令,转换成便于计算的文本,这里用到语音识别技术。

理解指令含义,确定要生成的是什么样的数字人,这涉及到自然语言理解。

再去执行指令,提取相应的视觉特征并生成符合的模型,靠的是一系列计算机视觉技术,

像这样跨模态融合,数字人终于能以完整的姿态登上央视,给广大观众来一场别开生面的技术科普。

当然,向公众展示科技的魅力和价值,还只是AI要做的事中一个小的部分,对于AI而言,更重要的还是要到各行各业中落地做实事。

第三个现状,AI想落地就得在真实业务场景中真正展现效果、产生效益,不然谁来为AI买单?

AI现阶段的一个特点是只擅长解决特定任务。那么以大规模预训练模型为例,在预训练-微调的范式中,最重要的是要找到合适的预训练任务。

像百度之前的ERNIE2.0语言模型,就是靠指定了单词、句子结构、语义三个层级上的任务,再结合创新的连续多任务学习,在权威测试GLUE上超越了当时的强者BERT,为后面的知识增强大模型打下基础。

虽然这里说的是纯技术上的任务,不过假如换个思路,把跑测试冲榜单当成AI企业自己要面对的业务场景,那么AI要落地到更多行业中,应该去哪里寻找任务的答案就呼之欲出了:

到场景中去,把技术与真实业务场景相融合

像这次百度世界大会现场,主持人和嘉宾的对话就是由如流智能会议纪要系统记录的,依托于AI技术,除了语音识别记录外,还能自动提取重要的内容形成摘要。

而现场同声传译系统展现的高质量、低延迟同传效果,则是百度大脑7.0机器翻译技术和同声传译场景融合的成果。

最后一个现状,AI真正落地到业务场景里不光是技术开发上的问题,还要考虑部署。

有了算法,接下来要思考如何更高效地使用算力。这就需要软件和硬件的融合,像苹果就是走了把算法和芯片深度整合的路,让手机发挥出电脑的实力。

硬件上,百度这次拿出的是自研AI芯片昆仑2代,采用全球领先的7nm制程和百度自研的2代XPU架构,并且已经实现量产。

昆仑芯2代除了性能比上代提高2-3倍外,场景上,它可以适用于云、端、边等多种场景,因而可覆盖互联网核心算法、智慧城市、智慧工业等诸多领域,并且在高性能计算机集群、生物计算、智能交通、无人驾驶等前沿研究中都有一展所长的潜力。

像这样,百度大脑7.0在软硬一体融合中释放出了更多可能性

随着百度大脑在以上4个融合方向上持续升级,涉及到的AI技术越来越复杂。

但AI要服务的范围却越来越大了,从熟悉AI的技术公司、互联网公司扩展到了传统行业、公共事业和个人生活。

降低应用门槛,就成了AI行业的另一大趋势

王海峰在这次百度世界大会上说:

百度的AI技术越来越强了,但应用的门槛反而是降低了。

如何做到的?

这得益于百度大脑的核心基座——飞桨深度学习平台。

百度飞桨作为开源平台向全社会开放,这个全社会可不是说说而已。

面对专业开发者,百度飞桨提供了产业级开源模型库、大规模分布式训练技术和多端多平台部署的高性能推理引擎。

面对成长期的开发者,百度飞桨也有AI Studio学习与实训社区,提供在线编程环境、免费GPU算力和开源数据及算法,更有AI学习路径和各类竞赛引导开发者学习成长。

面对入门开发者,百度飞桨还有EasyDL零门槛AI开发平台,不懂代码也能开发出自己的AI应用。

到目前为止,已有来自各行各业的360多万开发者通过飞桨平台开发了40万个AI模型,累计服务了13万企事业单位,涵盖工业、质检、农业、医疗、城市管理、交通、金融、体育等领域。

此外,百度飞桨还与多所高校合作,举办面向教师的深度学习师资培训,承办中国高校计算机大赛等多项赛事,为高校学生提供实习计划、就业指导。

本次百度世界大会上王海峰还宣布成立百度松果学堂,通过提供基础课程、技术竞赛、产业实训、科研基金,把未来5年培养500万AI人才的“口号”一步步落下来。

培养人才提升能力,从另一方面来讲,也是降低未来他们进入行业时的应用门槛。

说到最后,把降低门槛当成是在生态建设上的另一种融合创新也未尝不可。

技术创新+产业发展=经济发展新动能

说了这么多,百度大脑升级背后,百度的最新技术思考也就不难总结了。

核心其实就是,要进一步激发AI技术的价值,就需要把技术创新和产业发展有机融合在一起。

时下,数据资源已然是一种公认的关键生产要素。因此基于百度大脑这样的技术底座,百度智能云提出“数字化转型+智能化升级”,一步到位助力产业智能化的策略,事实上是在顺应数字经济发展的最新趋势。

简单来说,就是在诸如金融、医疗、制造、能源,乃至文娱体育这样的传统行业,不仅要搭建起自动化的系统来提高生产效率,还得把自身的数字资产充分利用起来,用智能化来激发新的增长点。

具体怎么做,百度也已经给出了实际案例。

刚刚在东京奥运会夺得7金5银的中国跳水队,背后就有一位隐形“AI教练”。

在这次百度世界大会上,百度创始人、董事长兼CEO李彦宏和中国跳水协会主席周继红现场连麦。周主席分享了百度智能云提供的“3D+AI”跳水辅助训练系统给日常训练带来的改变:

解决了跳水数据采集与分析方面的难题。有了这套系统,3秒就可以看到反馈,有时候出去开会、出差,也能看到队伍里的训练情况,反馈非常及时。系统可以切不同的角度,抠不同动作细节,一目了然。

在更贴近日常生活之处亦有验证。

例如在泉州水务集团,百度智能云联合埃睿迪基于百度大脑打造的泉州水务大脑,对生产流程实现了自动化控制和运维,大大减轻了人员管理压力。

在国网新疆电力,基于百度智能云和国网电力联手建设的“AI中台”,电站巡检机器人能够代替人捕捉巡检过程中的每一处细微差错,既缓解了偏远地区巡检人力紧缺、工作环境恶劣的难题,又有力为西电东送提供保障。

在旅游名城丽江,百度智能云建设的“城市大脑”正在致力于让居民和游客更加和谐相处:检测环境整洁度,通过紧急预案系统保障游客安全……

还有百度智能云牵手苏州工业园区打造的“智慧工厂”。在苏州常熟的恺博车间里,AI能够帮助质检工人“听音”、“识图”,提高制造效率和质量。还能对操作手册、维修历史记录等制造经验进行知识化处理,推动中国制造业从“制造”到“智造”。

实际上,这还只是个中典型,像这样的案例,如今可以说每天都在全国各地落地成真……

归根结底,这就是“融合创新”和“降低门槛”背后更深层的意义和思考:这样一条发展之路,其实就是在技术创新的基础上,如何更好地让技术本身和产业发展相结合,形成激发经济发展的新动能。

而这样的浪潮将推动中国的数字经济创造怎样新的成绩,令人无比期待。

你觉得呢?

一句话生成数字人形象、昆仑芯2量产…百度大脑升级7.0,王海峰:技术更强了门槛却更低...相关推荐

  1. 字节新专利可用人脸图像生成数字人;滴普科技获1.1亿元融资;科大讯飞成立人工智能科技公司 | 每日大事件...

    数据智能产业创新服务媒体 --聚焦数智 · 改变商业 01.字节新专利可用人脸图像生成数字人 近日,北京字跳网络技术有限公司申请的"数字人生成方法.装置.存储介质和电子设备"专利公 ...

  2. 【虚拟人快讯】超写实虚拟人青鸟发布,脑白金推出数字人形象

    1.3月17日,作为广西文化符号的"刘三姐"穿越时空,以国内首个省级超写实文旅数字推广大使的身份在全网公开亮相,广西壮族自治区文化和旅游厅厅长欧余军在"元宇宙世界&quo ...

  3. AI 数字人制作(方案一):输入一张图片和一段文字即可生成数字人

    方案一: 原文:AI 数字人制作(方案一)_哔哩哔哩_bilibili AI 文字和图片生成数字人(输入一张图片和一段文字即可生成数字人) <用三个开源项目整合成可以商用的数字人项目> 文 ...

  4. 去年押中数字人爆发,今年看好什么?百度研究院2022十大科技趋势预测出炉

    梦晨 发自 凹非寺 量子位 | 公众号 QbitAI "这不过是将来之事的前奏,也是将来之事的影子." AI之父阿兰·图灵,留下过这样一句经典名言,讲的是对科技趋势未来的笃信,但从 ...

  5. 首个AI数字人唱作歌曲刷屏背后:百度APP数字人度晓晓用AI陪伴亿万用户

    日前,一首新歌MV迅速登上各大音乐电台.多个音乐排行榜,甚至引发知名乐评人耳帝点赞,发问"音乐行业会不会被颠覆"?其实,这首新歌的"唱作人"并非真人,而是百度数 ...

  6. 16万辆汽车已经用上中国“车规AI第一芯”,量产还在加速

    贾浩楠 金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 上海车展上,一众自动驾驶供应商们,为智能电动车的"入场券"争先恐后. 而这种大背景下,中国汽车AI芯片的知名玩家 ...

  7. 扩容U盘恢复实际容量,芯邦量产工具,提示“低格版本比高格版本新”,GPIO 0025,CBM209X UMPToolV7100(2019-08-16),UMPTool 2019 版本

    1.原料:扩容U盘一个. 2.ChipGenius_v4_19_1225(ChipGenius.exe 金山毒霸报木马[木马病毒] Win32.Troj.Generic_a.a.(kcloud))检测 ...

  8. 元宇宙3D虚拟数字人形象设计开发及方案

    在元宇宙这个具有高度沉浸.虚实相生的数字逼真世界中,一切场景.交互.模型存在的意义都是为了满足人们的某种需求和期待.元宇宙3D虚拟形象将处于电脑/手机面前的人进行虚拟化.数字化,借助VR感官还原,去体 ...

  9. 第十三届光华工程科技奖公布,彭士禄、张伯礼、王海峰等40人及1个团体获奖

    萧箫 发自 北京会议中心 量子位 报道 | 公众号 QbitAI 刚刚,第十三届光华工程科技奖公布. 今年,全国范围内共产生296名候选人,最终仅有40位科学家及1位团体获奖,他们来自不同的工程学科领 ...

最新文章

  1. App 上传遇到问题
  2. SpringBoot 快速开启事务(附常见坑点)
  3. python enumerate函数_Python中enumerate函数用法详解
  4. 如何将Springboot项目成功部署到linux服务器上?
  5. python连接influxdb_python 访问 InfluxDB 数据库
  6. AOS编排语言系列教程(六):创建共享云硬盘EVS
  7. python时间函数的使用
  8. 求生之路显示服务器指令,求生之路2控制台指令..doc
  9. Understand层级关系视图中几种分类的介绍
  10. 部署SCOM2012 SP1
  11. 2020职场自顾自说
  12. javascript计算两条直线的夹角
  13. 朗文当代高级词典LONGMAN.Dictionary
  14. Excel插件POI-ET扩展(NiceXSSFWorkbook)说明
  15. 设定计算机锁定时间,如何设置电脑自动锁屏时间?
  16. 微信公众号如何上传文档附件_公众号添加Excel、PDF、PPT等附件教程
  17. apache性能调优(转)
  18. C++——计算x的n次幂
  19. 游戏十连模拟器(html版)
  20. DiskGenius清除分区空闲空间后硬盘满了

热门文章

  1. 将选择元素绑定到Angular中的对象
  2. 使用curl上传带有文件的POST数据
  3. 我应该使用i标签代替span吗? [关闭]
  4. 什么是Unwind segues,您如何使用它们?
  5. 如何将参数传递给批处理文件?
  6. 如何仅从SQL Server DateTime数据类型返回日期
  7. 浅析jQuery原理并仿写封装一个自己的库
  8. 操作-《oracle入门到精通》第六章开始
  9. poj 1950 Dessert(dfs枚举,模拟运算过程)
  10. Chrome Full black Screen [Solved]