7月4日召开的百度AI开发者大会(Baidu Create 2018)上,百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰发布百度大脑3.0,并指出,百度大脑3.0的核心是“多模态深度语义理解”,包括数据的语义,知识的语义,以及图像、视频、声音、语音等各方面的理解。

多模态深度语义理解如何在技术上实现?拥有多大的能量?它将如何被应用来改变我们的生活?当天下午的百度大脑论坛中,百度大脑3.0的核心技术一一“亮相”,为开发者们带来一场技术盛宴。

从“看清听清”到“看懂听懂”

“多模态深度语义理解能让机器听清、看清,更能深入理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用。”王海峰表示。

视觉语义化可以让机器从看清到看懂视频,并提炼出结构化语义知识。百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤介绍,视觉语义化技术首先识别人、物体和场景,同时捕捉它们之间的行为和关系,通过时序化、数字化、结构化的方式形成语义知识,最终结合领域和场景进行智慧推理,落地行业应用。比如在零售领域,它可以准确判断每个人的动作、行为,真正实现顾客拿起商品就走。未来,视觉语义化技术还可进一步延展,它结合新型的传感器和AI芯片,可以在感知层面和计算层面得到大幅提升;结合手机可以带给用户更佳地使用体验。未来,百度视觉语义化技术将在百度AI开放平台中开放给开发者使用。

语音技术的升级则让机器更好地听懂世界。百度语音技术部总监高亮表示,百度基于远场的语音语义一体化技术取得重大突破,为业界提供更顶尖的远场语音技术。语音语义一体化将远场交互中高频Query识别准确率提升10个点,并保持普通Query识别率不降;多语种混合声学建模基于Deep Peak2大幅提升中英文混合Query识别准确率,相对错误率比业界最好竞品降低20%;新升级的TTS技术业界首创传统拼接技术与Wavenet技术融合方案,保证合成质量的同时大大降低成本,让大规模应用落地成为现实。此外,百度重磅发布远场语音技术低成本解决方案“度小云”,它基于Deep Peak V2语音识别技术、语音语义一体化技术及LSTM-VAD深度学习语音切分技术,实现业界领先的五级唤醒技术,并拥有基于Wavenet的精致音库,支持远场优化的音频通信技术。未来开发者可以平等便捷地一站式获取百度远场语音能力。

想要让机器像人一样拥有智能,将语言变成知识必不可缺。百度AI技术平台体系执行总监吴甜表示,百度自然语言处理技术经过多年的发展,已形成全面、前沿的格局。百度知识图谱已发展为复杂、多元、全面的多元语义知识图谱,包含实体图谱、行业图谱、事件图谱、关注点图谱、多媒体图谱,其中实体图谱已经能够覆盖通用需求中90%的实体及其属性。在阅读理解技术上,百度大脑已经阅读了千亿量级的文章,相当于6万个中国国家图书馆的藏书,并由此积累了亿级实体、千亿事实的知识,并通过“学习”真实应用每天产生的知识不断优化。在对话理解方面,百度理解与交互技术平台UNIT升级至2.0,进一步增强冷启动能力,支持像人类一样在对话当中学习,同时开放了第一个工业级对话系统开源框架,降低搭建门槛,让开发者无缝对接云端。百度将持续开源新的技术,提供更灵活便捷的方案,推动自然语言理解技术的创新与发展。

夯实基础:数据、算法、算力并驾齐驱

数据、算法、算力是影响人工智能技术发展的重要因素。主论坛中,王海峰表示百度大脑3.0首次将芯片纳入技术体系,带动百度大脑算力爆发式增长。百度自主研发的中国第一款云端全功能AI芯片“昆仑”也在会上首次亮相。未来,AI芯片将与百度自主研发的PaddlePaddle深度学习框架相结合,推动AI行业生态快速发展。

百度在2016年正式开源的PaddlePaddle,是最适合中国开发者的深度学习框架。主论坛中,王海峰发布PaddlePaddle3.0,下午,百度AI技术生态部总经理喻友平对此进行了详细解读。PaddlePaddle3.0包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以让开发者平等便捷获取顶尖AI能力的平台。PaddlePaddle3.0核心框架对服务器版本以及移动端版本进行了全面优化,PaddlePaddle Fluid提供丰富的满足常见主流模型搭建需求的API,支持广泛的模型搭建,训练Runtime可以满足各类型的模型训练需求;PaddlePaddle Serving可灵活适配多种预测引擎;PaddlePaddle Mobile集成百度移动端预测的实践经验,提供多平台支持。

PaddlePaddle3.0中,AutoDL备受关注。百度大数据(北京)实验室主任浣军介绍,AutoDL能更高效自动搜索神经网络结构,开发者无需特殊硬件设备可以快速得到高质量模型。AutoDL提供多种能力,支持设计全新深度学习网络结构,以及优化现有深度学习网络结构及参数,同时能够适配特定任务场景。

海量数据爆发式增长,发掘数据价值成为众多行业的普遍需求。百度大数据部总监郭谢表示,百度已形成从数据到数据工程、数据科学、数据产品再到行业方案的大数据产品技术栈,基于大数据特性,从生产资料和生产工具两方面促进产业发展。为了最大程度保证数据安全,百度正式发布大数据众智开放平台“点石”,基于全球领先的百度AI技术,全方位保障数据安全,并逐步开放工具能力,为行业数据安全赋能。

现场,百度启动了多项大赛。百度之星开发者大赛将如期回归,此外还有基于PaddlePaddle的中国高校计算机大赛人工智能创意赛、KG-知识抽取赛、交通预测赛、无人车系列大赛,以及商家招牌的分类与检测、人工智能加速器应用与设计等大数据比赛。百度方面表示,欢迎各路高手挑战,通过大赛携手推动整个AI产业的发展。

百度王海峰:多模态深度语义理解将让AI更深地理解真实世界相关推荐

  1. 24年前他被余承东招入华为,现在掌舵第四大事业群,对垒阿里张建锋、百度王海峰,腾讯汤道生

    新年架构新变,不再隐藏雄心,志在打赢时代之战. 这就是2020开年,华为刚作出的重要架构调整: "Cloud&AI产品与服务"部门,升级成为华为第四大BG(事业群),与运营 ...

  2. 24年前他被余承东招入华为,现在掌舵第四大事业群,对垒阿里张建锋、百度王海峰,腾讯汤道生...

    黑客技术 点击右侧关注,了解黑客的世界! Java开发进阶 点击右侧关注,掌握进阶之路! Python开发 点击右侧关注,探讨技术话题! 作者丨乾明     发自 凹非寺  来源丨量子位(QbitAI ...

  3. 百度CTO王海峰:亚洲丰富实践场景推动AI技术落地探索

    本文已在飞桨公众号发布,查看请戳链接: 百度CTO王海峰:亚洲丰富实践场景推动AI技术落地探索 王海峰 百度首席技术官 亚洲地区国家众多,发展水平差异显著,这背后意味着有丰富的实践场景,可供AI技术落 ...

  4. 百度CTO王海峰:深度学习平台+大模型,夯实产业智能化基座

    2月27日,中国人工智能学会首届智能融合产业论坛在成都顺利举办.本届论坛由中国人工智能学会(CAAI)主办,中国人工智能学会智能融合专委会.百度公司.深度学习技术及应用国家工程研究中心和电子科技大学联 ...

  5. 百度Create AI开发者大会,百度CTO王海峰:“深度学习+”是创新发展新引擎

    1月10日,百度Create AI开发者大会成功举办,聚焦"创造者精神",分享创新与增长理念,与开发者和创造者们一道激发科技想象力,开拓创新创造新天地. 百度首席技术官王海峰表示, ...

  6. 百度CTO王海峰:深度学习如何大规模产业化?

    编者按:10月17日-19日,2019年中国计算机大会(CNCC2019)在苏州举办.百度首席技术官王海峰在会上发表题为<深度学习平台支撑产业智能化>的演讲,分享了百度关于深度学习技术推动 ...

  7. 独家首发|汇聚知识 理解世界——百度王海峰谈知识图谱的最新演讲笔记

    本文节选于百度副总裁.百度AI技术平台体系总负责人兼百度研究院院长.国际计算语言学协会(Association for Computational Linguistics)前主席王海峰先生在11月8日 ...

  8. 独家首发|汇聚知识 理解世界 百度王海峰谈知识图谱的最新演讲笔记

    本文节选于百度副总裁.百度AI技术平台体系总负责人兼百度研究院院长.国际计算语言学协会(Association for Computational Linguistics)前主席王海峰先生在11月8日 ...

  9. 中科院陆汝钤获吴文俊人工智能最高成就奖,百度王海峰获吴文俊人工智能杰出贡献奖...

    来源:AI 科技评论 12 月 9 日上午,被誉为「中国智能科学技术最高奖」的吴文俊人工智能科学技术奖在苏州举行颁奖典礼.本届吴文俊人工智能奖共对 70 项人工智能成果授奖,包括吴文俊人工智能最高成就 ...

最新文章

  1. 写文件函数 Linux C fwrite,C文件读写函数介绍(转)
  2. CVPR 2018 SINT++:《SINT++: Robust Visual Tracking via Adversarial Hard Positive Generation》论文笔记
  3. 工业级PoE交换机是如何进行工作的?使用中要注意什么?
  4. 从零开始编写深度学习库(五)ConvolutionLayer CPU编写
  5. Javascript中document.execCommand()的用法
  6. netty权威指南学习笔记一——NIO入门(4)AIO
  7. Spring+Netty4实现的简单通信框架
  8. HTML5开发能不能取代原生开发?
  9. php 中的全局变量的理解
  10. 计算机中常用的三种码制,码制
  11. file js new 传到后台_JS读取文件且AJAX传输到后台
  12. php 美化登录页面,把你的WordPress登录页面进行CSS美化
  13. 简要分析VB6.0和VB.NET区别
  14. Mybatis学习之一 引入dtd文件
  15. 爆爆爆!!Deep Mind与Google Brain合并,成立 Google DeepMind 新部门
  16. python数据分析:商品数据化运营(上)——知识点
  17. JDK8 双冒号用法
  18. 如何用css只做一个div鼠标点击变色
  19. mysql密码为空包密码错误_apk空包签名方法及工具
  20. B. Marvolo Gaunt’s Ring (递推)

热门文章

  1. HLG 1481 Attack of the Giant n-pus【二分+二分图完全匹配】
  2. 交通安全与智能控制专业学计算机吗,交通安全与智能控制专业就业方向及就业前景分析...
  3. css小技巧 -- 单标签实现单行文字居中,多行文字居左
  4. hexo博客更新主题后上传Git操作
  5. H5 客户端设置title 滑动验证码
  6. 通过域名访问自己部署到服务器上的项目
  7. Spring MVC 返回json数据 报406错误 问题解决方案
  8. 对PInvoke函数函数调用导致堆栈不对称。原因可能是托管的 PInvoke 签名与非托管的目标签名不匹配。...
  9. IOS使用正则表达式去掉html中的标签元素,获得纯文本
  10. JDE函数--GetUDC(B函数)