7月4日召开的百度AI开发者大会(Baidu Create 2018)上,百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰发布百度大脑3.0,并指出,百度大脑3.0的核心是“多模态深度语义理解”,包括数据的语义,知识的语义,以及图像、视频、声音、语音等各方面的理解。

\\

在上午的主论坛上,李彦宏现场演示的一段AI客服给参会者打电话的视频让人印象深刻:

\\

https://v.qq.com/x/page/o0711bxuu7z.html

\\

据了解,这一功能的实现就是依靠百度大脑3.0的多模态深度语义理解能力。

\\

多模态深度语义理解如何在技术上实现?拥有多大的能量?它将如何被应用来改变我们的生活?当天下午的百度大脑论坛中,百度大脑3.0的核心技术一一“亮相”,为开发者们带来一场技术盛宴。

\\

可容纳1000人的会场座无虚席,开发者们甚至席地而坐,或者站在会场最后听完整场分享。一位开发者表示,“干货太多、时间太少,回去要找回放视频好好消化一下。”

\\

从“看清听清”到“看懂听懂”

\\

“多模态深度语义理解能让机器听清、看清,更能深入理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用。”王海峰表示。

\\

\\

视觉语义化可以让机器从看清到看懂视频,并提炼出结构化语义知识。百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤介绍,视觉语义化技术首先识别人、物体和场景,同时捕捉它们之间的行为和关系,通过时序化、数字化、结构化的方式形成语义知识,最终结合领域和场景进行智慧推理,落地行业应用。比如在零售领域,它可以准确判断每个人的动作、行为,真正实现顾客拿起商品就走。未来,视觉语义化技术还可进一步延展,它结合新型的传感器和AI芯片,可以在感知层面和计算层面得到大幅提升;结合手机可以带给用户更佳地使用体验。未来,百度视觉语义化技术将在百度AI开放平台中开放给开发者使用。

\\

\\

语音技术的升级则让机器更好地听懂世界。百度语音技术部总监高亮表示,百度基于远场的语音语义一体化技术取得重大突破,为业界提供更顶尖的远场语音技术。语音语义一体化将远场交互中高频Query识别准确率提升10个点,并保持普通Query识别率不降;多语种混合声学建模基于Deep Peak2大幅提升中英文混合Query识别准确率,相对错误率比业界最好竞品降低20%;新升级的TTS技术业界首创传统拼接技术与Wavenet技术融合方案,保证合成质量的同时大大降低成本,让大规模应用落地成为现实。此外,百度重磅发布远场语音技术低成本解决方案“度小云”,它基于Deep Peak V2语音识别技术、语音语义一体化技术及LSTM-VAD深度学习语音切分技术,实现业界领先的五级唤醒技术,并拥有基于Wavenet的精致音库,支持远场优化的音频通信技术。未来开发者可以平等便捷地一站式获取百度远场语音能力。

\\

\\

想要让机器像人一样拥有智能,将语言变成知识必不可缺。百度AI技术平台体系执行总监吴甜表示,百度自然语言处理技术经过多年的发展,已形成全面、前沿的格局。百度知识图谱已发展为复杂、多元、全面的多元语义知识图谱,包含实体图谱、行业图谱、事件图谱、关注点图谱、多媒体图谱,其中实体图谱已经能够覆盖通用需求中90%的实体及其属性。在阅读理解技术上,百度大脑已经阅读了千亿量级的文章,相当于6万个中国国家图书馆的藏书,并由此积累了亿级实体、千亿事实的知识,并通过“学习”真实应用每天产生的知识不断优化。在对话理解方面,百度理解与交互技术平台UNIT升级至2.0,进一步增强冷启动能力,支持像人类一样在对话当中学习,同时开放了第一个工业级对话系统开源框架,降低搭建门槛,让开发者无缝对接云端。百度将持续开源新的技术,提供更灵活便捷的方案,推动自然语言理解技术的创新与发展。

\\

\\

夯实基础:数据、算法、算力并驾齐驱

\\

数据、算法、算力是影响人工智能技术发展的重要因素。主论坛中,王海峰表示百度大脑3.0首次将芯片纳入技术体系,带动百度大脑算力爆发式增长。百度自主研发的中国第一款云端全功能AI芯片“昆仑”也在会上首次亮相。未来,AI芯片将与百度自主研发的PaddlePaddle深度学习框架相结合,推动AI行业生态快速发展。

\\

百度在2016年正式开源的PaddlePaddle,是最适合中国开发者的深度学习框架。主论坛中,王海峰发布PaddlePaddle3.0,下午,百度AI技术生态部总经理喻友平对此进行了详细解读。PaddlePaddle3.0包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以让开发者平等便捷获取顶尖AI能力的平台。PaddlePaddle3.0核心框架对服务器版本以及移动端版本进行了全面优化,PaddlePaddle Fluid提供丰富的满足常见主流模型搭建需求的API,支持广泛的模型搭建,训练Runtime可以满足各类型的模型训练需求;PaddlePaddle Serving可灵活适配多种预测引擎;PaddlePaddle Mobile集成百度移动端预测的实践经验,提供多平台支持。

\\

\\

PaddlePaddle3.0中,AutoDL备受关注。百度大数据(北京)实验室主任浣军介绍,AutoDL能更高效自动搜索神经网络结构,开发者无需特殊硬件设备可以快速得到高质量模型。AutoDL提供多种能力,支持设计全新深度学习网络结构,以及优化现有深度学习网络结构及参数,同时能够适配特定任务场景。

\\

\\

海量数据爆发式增长,发掘数据价值成为众多行业的普遍需求。百度大数据部总监郭谢表示,百度已形成从数据到数据工程、数据科学、数据产品再到行业方案的大数据产品技术栈,基于大数据特性,从生产资料和生产工具两方面促进产业发展。为了最大程度保证数据安全,百度正式发布大数据众智开放平台“点石”,基于全球领先的百度AI技术,全方位保障数据安全,并逐步开放工具能力,为行业数据安全赋能。

\\

\\

现场,百度启动了多项大赛。百度之星开发者大赛将如期回归,此外还有基于PaddlePaddle的中国高校计算机大赛人工智能创意赛、KG-知识抽取赛、交通预测赛、无人车系列大赛,以及商家招牌的分类与检测、人工智能加速器应用与设计等大数据比赛。百度方面表示,欢迎各路高手挑战,通过大赛携手推动整个AI产业的发展。

\\

业内人士评价,百度在推动技术落地的同时不断反哺技术升级,如今已成为国内人工智能领域的领航者。百度大脑升级至3.0,也标志着百度AI技术的一次跨越式升级,正如王海峰在开场中所强调,“百度AI能力的核心是百度大脑,百度大脑3.0是百度AI能力的集大成者。”。基于百度大脑持续突破的技术实力,百度有能力把顶尖的AI技术提供给中国开发者、企业,更让每个开发者和企业都能平等获取顶尖AI能力,继而让AI在中国遍地开花。

百度AI开发者大会百度大脑论坛:详解“多模态深度语义理解”相关推荐

  1. 2017百度AI开发者大会召开,智能云计算分论坛聚焦ABC

    7月5日, 2017百度AI开发者大会智能云计算分论坛在北京国家会议中心召开.百度总裁张亚勤,百度副总裁.百度云总经理尹世明,英特尔人工智能集团CTO Amir Khosrowshahi,英伟达中国区 ...

  2. 从人工到智能 百度AI开发者大会分论坛,探寻国球乒乓背后的AI之路

    近日,百度Create 2021(百度AI开发者大会)在"元宇宙"空间希壤正式召开.在29日的AI开发者大会人才培养分论坛上,来自百度.学界及各行各业开发者也齐聚一堂,聆听行业大咖 ...

  3. 百度AI开发者大会AI+5G论坛热度爆表,用技术撬动下一个百亿市场

    7月4日上午,以"构建AI与5G.边缘计算深度融合发展生态,促进AI边缘计算技术和平台共享"为主题的"Baidu Create 2019"百度AI开发者大会AI ...

  4. 从人工到智能!百度AI开发者大会分论坛,探寻国球乒乓背后的AI之路

    近日,百度Create 2021(百度AI开发者大会)在"元宇宙"空间希壤正式召开.在29日的AI开发者大会人才培养分论坛上,来自百度.学界及各行各业开发者也齐聚一堂,聆听行业大咖 ...

  5. 2018百度AI开发者大会以及个人对百度开发平台的观点

    浅谈百度的开放能力既百度开发者大会感悟 今年七月份正在玩Duer OS的我有幸得到一张百度开发者大会的门票,这让我重新认识了百度,和百度的执行能力. 没记错的话是今年的六月份,陆奇离职百度,这是在外界 ...

  6. 百度AI开发者大会-你是其中一个嘛?百度Create大会(无人驾驶)

    导读:2017年百度推出科技顶级盛会,也是全球规模最大的AI开发者大会.大会主要面向企业和技术开发者.科技爱好者,旨在探讨国际前沿技术和产业应用,打造中国的AI技术高地. 今日,下午两点直播大会,会上 ...

  7. 百度ai开发者大会讲了点什么

    很高兴csdn给我机会,让我参加了7.5百度ai开发者大会,大会结束后,网上铺天盖地的报道也是层次不穷,我看了一下国内和国外媒体的介绍,大家对这次百度无人驾驶技术津津乐道. 下面就我的个人感受写一下, ...

  8. 直播|百度AI开发者大会深度学习直播课程表

    百度AI开发者大会,备受国内人工智能工程师界瞩目.今年的大会定在7月4日-7月5日举办,为了方便各位开发者,主办方添加了直播渠道. 众多直播内容中,深度学习公开课可以说是重中之重.此次深度学习公开课邀 ...

  9. 调用百度ai接口实现图片文字识别详解

    调用百度ai接口实现图片文字识别详解 首先先介绍一下这篇博文是干嘛的,为了不浪费大家时间.公司最近和短视频公司合作,需要监控app的截图上的文字是否符合规范,也就是确保其没有违规的文字.到网上找了一些 ...

最新文章

  1. 博士毕业,信心满满的去面算法工程师,竟然凉了...
  2. 算法笔记1-最大子序列和问题的求解
  3. [转]SQL交叉表实例
  4. php如何获取常量的值,php – 如何获取常量的名称?
  5. 【大规模深度强化学习(一) 】深度强化学习中的异步方法(A3C)
  6. VR:下一个技术风口
  7. 经典的CSS代码(转)
  8. 视频录制工具OBS选择区域录制
  9. Linux下tar压缩解压命令详解
  10. 高质量的博客评论外链有用么?
  11. sftp服务器下载文件至本地电脑
  12. JFinal极速开发微信公众号
  13. 服务器网站权限,在服务器上设置网站权限
  14. linux内核自旋锁解释,LINUX内核笔记:自旋锁
  15. 量化投资:为什么在中国发展之路任重而道远
  16. MobaXterm中文版
  17. NO.16-SAP S4 HANA Cloud中的工序委外和委外加工(1)
  18. 从事着项目管理工作。已通过pmp考试,是继续考ACP好还是NPDP好?
  19. 【Test】GacUI 1.0 眼看着就要写完了 (4)
  20. 总会计师是什么职务?

热门文章

  1. MySQL怎么导出用户权限表_导出MySQL用户权限_MySQL
  2. java中double类型占几个字节_面试官:Java 中有几种基本数据类型是什么?各自占用多少字节?...
  3. 怎么在anaconda上安装python_win10肿么在已安装python2.7的基础上安装anaconda
  4. json_decode用法
  5. 汇总少了退款汇总 多了一笔支付汇总 很可能是因为商户退款配置的是正交易权限(配置的问题)
  6. 微服务架构之Spring Cloud Eureka入门程序
  7. linux内核之kfifo队列
  8. 盘点一下结构体标签在Go中的应用
  9. SQL常用的几个窗口函数
  10. Nginx应用场景之动静分离