百度大脑5.0实现史上最大升级,发布远场语音交互芯片“鸿鹄”
大数据文摘出品
“这是百度大脑历史上最具跨越性的升级。”
7月3日的百度开发者大会上,百度首席技术官王海峰正式发布百度大脑5.0,并在下午的百度大脑分论坛,公布了其在AI算法、计算架构和应用场景各方面的新进展。
提出流式多级的截断注意力模型SMLTA
升级后的百度大脑5.0更加强调AI技术的标准化、自动化和模块化。
百度语音技术部高级总监高亮介绍,识别方面,百度提出流式多级的截断注意力模型SMLTA,这是国际上首次实现局部注意力建模超越整句的注意力模型,也是国际上首次实现在线语音大规模使用注意力模型。
SMLTA在大幅提升识别速度的同时,也提高了识别准确率。在输入法有效产品相对准确率提升15%,音箱有效产品相对准确率提升20%。
合成方面,针对现阶段面临风格迁移、音色模拟和情感拟人的三大挑战,百度推出语音合成技术Meitron,可以将语音中的音色、风格、情感等要素映射到不同的子空间,在使用时,不同要素可以任意组合,灵活的控制合成语音的风格。同时降低语言合成门槛,仅需20句话就可以制作一个人的专属声音。
发布针对远场语音交互打造的芯片——百度鸿鹄芯片
对于落地应用正在端侧呈现出巨大需求,百度大脑语音团队研发出一款针对远场语音交互打造的芯片——百度鸿鹄芯片。
鸿鹄芯片的设计遵循“软件定义芯片”的全新设计思路。该芯片采用双核HiFi4架构,2.8M大内存,台积电40nm工艺,在此硬件规格上,100mw左右平均工作功耗,即可支持远场语音交互核心的阵列信号处理和语音唤醒能力。同时,按照车规级标准打造使鸿鹄芯片可满足极严格的需求,将为车载语音交互,以及智能家居等场景带来更大想象力。鸿鹄芯片流片的同时,即实现了量产。
交互升级包含一体化人机交互系统和大场景物理世界交互系统。简单而言,一体化人机交互系统是人与机器、虚拟环境的自然交互与融合,该系统适用于实现AR特效的直播、小视频、特效小程序等场景,已应用于百度多款视频App。
大场景物理世界交互系统是将视觉定位与AR技术突破性结合,实现大范围的虚拟信息与物理世界的精准叠加,从而建立起AI时代全新的交互系统。目前,软硬件结合可以满足应用场景更高效的视觉计算,以及更低延时的体验,同时能保护数据隐私。百度视觉方面的软硬件结合主要聚焦于模型压缩平台PaddleSlim、多模态FaceID开发组件以及软硬件一体解决方案AI相机三部分。FaceID覆盖设备量已超1200万台。
视觉语义化平台更新至2.0
视觉语义化平台2.0更新了许多先进的感知技术,也让机器人技术实现新突破。
百度三维视觉首席科学家杨睿刚介绍,机器人就是一个智能体,除了感知技术,智能体需要决策和动作相关的技术,实现从环境感知到主动感知。目前,百度研究的智能体技术主要集中在自动驾驶Apollo、工程机械和服务机器人三大方面。
上午主论坛中王海峰现场与一只机械臂“茶博士”进行了互动对话,还完成了传统的长嘴壶倒茶工作,其背后依靠的正是服务机器人方案。
基于百度3D视觉,机器人可以对茶杯的位置进行检测和追踪。通过机器人运动规划和控制,机械臂可以对工作空间进行碰撞检测,避开障碍物;实时规划运动后,可自动生成倒茶轨迹;随后,感知水流变化,,王海峰在演示过程中故意改变了茶杯位置,茶博士也准确识别出了相关位置并成功续茶。
迎接5G时代,发布新一代AI计算架构
百度大脑5.0不仅包含算法层面创新,在算力方面也实现重大突破。近年来,算法对算力需求增长近300,000倍,而芯片的计算性能仅提升30倍,两者之间存在巨大鸿沟。
百度副总裁侯震宇为现场观众分享了百度新一代AI计算架构。面对AI计算的挑战,需要能够从端到端来提供AI计算能力,这要求计算系统从旧有的对海量数据处理能力、对IO高峰值的追求,转变为满足AI训练功能方面IO密集、计算密集、通信密集的需求,和AI推理功能方面大吞吐和低延迟的需求。
侯震宇认为,面对即将到来的AI+5G时代,计算将无处不在。真正的计算会发生在设备(Device)、边缘(Edge)和云(Cloud)中,因而D-E-C场景将会是接下来需要重点研究的问题;与此同时,包括芯片之间、系统之间、设备之间的互相连接,将帮助不同场景中的计算连接在一起,产生更大的计算力。
百度大脑5.0实现史上最大升级,发布远场语音交互芯片“鸿鹄”相关推荐
- AI芯片、框架、语言与知识、量子计算……百度大脑6.0发布
9月15日,科技界年度盛会"百度世界2020"线上开幕.今年的百度世界大会由百度与"央视新闻"联合呈现,上午刚刚结束的主论坛精彩纷呈,反响热烈,花式登上热搜:百 ...
- 百度世界2020大会技术干货硬核来袭,百度大脑6.0跃升AI新型基础设施
点击左上方蓝字关注我们 9月15日,科技界年度盛会"百度世界2020"线上开幕.今年的百度世界大会由百度与"央视新闻"联合呈现,上午刚刚结束的主论坛精彩纷呈,反 ...
- 《 百度大脑AI技术成果白皮书》,介绍百度大脑5.0,附48页PDF下载
来源:专知 [导读]百度大脑是百度AI集大成者,自2010年起开始积累基础能力,2019年升级为5.0,成为软硬件一体的AI大生产平台.百度发布< 百度大脑AI技术成果白皮书>,详细介绍了 ...
- 五大服务顺序_百度大脑5.0技术干货:详解飞桨五大优势,鸿鹄芯片架构细节
智东西 文 | 心缘 智东西7月8日消息,近日,2019百度AI开发者大会在北京国家会议中心举行.在上午的主论坛中,百度CTO王海峰带来了软硬一体的AI大生产平台--百度大脑5.0,宣布百度飞桨与华为 ...
- 【每日新闻】百度CTO王海峰发布百度大脑5.0
点击蓝字 关注我们 更多精彩,请点击上方蓝字关注我们! 每日新闻播报 第07-03期 1 趋势洞察 Gartner:云是数据库市场的未来 根据Gartner预测,到2022年将有75%的数据库被部署到 ...
- 360安全卫士11.0史上最小版发布,去流氓,最精简,300MB内存轻松运行。完全不拖慢电脑的速度,由王宁诚意发布。...
360安全卫士11.0史上最小版发布,也是史上最快版本. 大家可能都不喜欢360,为什么?因为360太流氓,而大家想过如果360去掉了流氓会怎么样?对,那样360就会变成一个性能可以超过知名杀毒软件- ...
- android版本的微信更新,史上最大升级 安卓微信7.0新版对比旧版详细体验
近几天,坊间一直传闻微信将有大动作,结果--iOS版微信7.0.0上线了.就在安卓版童鞋集体仰慕苹果版的"待遇"时,安卓版微信7.0.0也开启内测了. 简单看了下,新版的变化还是蛮 ...
- 百度品牌全知道html,史上最全!百度SEM系数大合辑,我不信你都知道~~
原标题:史上最全!百度SEM系数大合辑,我不信你都知道~~ 作者:耿冰洋 来源:www.27sem.com 目前中国网络搜索推广系统最完善的就是百度凤巢系统,百度也在不断地完善自己系统产品分类,我们从 ...
- 免费报名!百度大脑开放日·互联网内容安全线上专场来袭
什么是百度大脑开放日? 百度大脑自 2016 年启动开放以来,已打造成为业内最全面.最领先的 AI 开放平台,服务规模.调用量都居于业界第一. 百度大脑开放日于 2019 年开办,覆盖北/上/深等 ...
- 华为史上最大规模升级!鸿蒙系统进度发布:近百款机型已适配
自从HarmonyOS系统正式发布之后,华为就开始了史上最大规模的系统升级计划,覆盖面积非常广泛,号称是"百"机焕新计划,覆盖了许多老款机型,基本上存量的老用户都能体验到Harmo ...
最新文章
- CVPR 2021 | 国防科大:基于几何稳定性分析的物体位姿估计方法
- [文章集合] 在Windows Server 2012上关于Vmware的几点
- ASP.NET 2.0角色及成员管理
- Clone Graph
- STM32 进阶教程 13 – FLASH的读写操作
- Spring Security Java Config Preview--官方
- leetcode 476. 数字的补数(Java版)| How to extract ‘k’ bits from a given position in a number
- java读取文件中的数组中_使用java中的数组从文本文件中读取关键字
- (自动重命名论文)PaperDownloader (Chrome插件) + EndNote (附下载链接) + Zotero
- tomcat查看线程数
- IT工程项目需求获取的主要方法
- ui设计网站资料大全,你想要的都有
- 清华大学计算机刘旭鑫,助学服务 | 走近广东狮子会客家希望班高考“学霸”刘旭鑫、程春花同学...
- 一个程序员未来5年的自我规划
- Git - git push origin master 报错的解决方法 出现[rejected] master -」 master (non-fast-forward)问题解决
- 51nod 1457:小K vs. 竹子
- 【Win8操作系统中OEM分区创建技巧】
- 使用torch.nn.functional.pad填充图片
- [开源][130522]DIY简易红外遥控信号发射器
- 银行贷款与网上借贷比较
热门文章
- 谷歌地图地名显示繁体字_谷歌地图卫星地图怎么取消地名还有路线
- html鼠标悬停效果加边框,js实现鼠标悬浮给图片加边框的方法
- MySQL的连接字符串 concat、concat_ws、group_concat、repeat()函数用法
- 什么软件测试显示器响应时间准,液晶响应时间测试系统
- java 编写浏览器_用Java自己写一个浏览器 —— JavaFX 入门
- 中国手机摄像头产业链
- RS485接口上的PTC
- 4.20 使用条件格式标识包含指定文本的单元格 [原创Excel教程]
- 硬盘安装Win7教程!无光驱无U盘照样装Win7
- Mellanox IB卡介绍