当输入告别键盘,语音、表情、动作都成为输入方式,会是一种怎样的神奇体验?

1月16日,在百度输入法“AI·新输入 全感官输入2.0”发布会上,国内首款真正意义上的AI输入法——百度输入法AI探索版正式亮相,这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。同时,百度宣布语音技术取得一项对全球学术界和工业界都具备重大意义的技术突破,流式截断的多层注意力建模(SMLTA)将在线语音识别精度提升了15%,并在世界范围内首次实现了基于Attention技术的在线语音识别服务大规模上线应用。

发布会现场,百度高级副总裁王海峰表示,输入法是离用户最近的产品之一,也是AI落地的“桥头堡”,百度全方位的AI能力正在不断赋能输入法,让输入法更“聪明”。他也给出了输入法行业的“未来画像”,他认为,虽然目前的输入法产品主要应用于手机端,但未来的输入法将应用于各种智能设备与用户的交互,并走向世界,为全球用户提供更多元的输入方式。

(百度高级副总裁王海峰)

据介绍,截至2018年底,百度输入法月活跃人数已达5亿,语音日请求量峰值突破5.5亿,AR表情使用次数超过1亿。同时,百度海外输入法全球安装量超过1亿,支持120种语言,覆盖全球190个国家地区,并已与超过100个全球知名IP达成合作,实现技术与市场的双丰收。

SMLTA语音识别精度全球领先 语音技术创新带动交互变革

百度输入法AI探索版是百度AI落地应用的又一重要成果,全语音交互是它最大的特点之一。“虽然当前输入法主流是键盘输入,但对用户需求变化的洞察,让我们有信心较早地推出这款全语音交互的产品”,百度中文输入法负责人蔡玉婷表示,相较2016年,百度输入法日均语音请求量增长了8倍,语音输入法的场景也从聊天和搜索拓展到游戏、娱乐、购物等众多场景。

(百度中文输入法负责人蔡玉婷)

全语音交互对于语音识别准确率要求极高,百度推出全语音交互输入法的信心,还来自于百度领先业界的语音技术。现场,百度语音技术部负责人高亮宣布了百度语音输入的四项重大突破和给输入法用户带来的体验提升。

在线语音领域,百度发布流式截断多层注意力建模(SMLTA),这是中文在线语音识别历史上的两个重大突破:世界上首次实现了局部注意力建模识别精度超过全局注意力模型;世界上第一次大规模部署在线语音交互注意力模型。这一技术能够解决传统Attention模型在识别中的时延性,以及因此导致的无法进行大规模在线语音实时交互的问题,并将在线语音识别精度提升了15%,超越行业最高水平15%。

(百度语音技术部负责人高亮)

离线语音识别领域,为解决用户多元输入场景的需求,百度持续优化Deep Peak 2系统,让离线语音输入相对准确率再次提升,高于行业平均水平35%。即使用户处于地铁、电梯、隧道或人流密集等离线场景中,依然可以借助百度输入法进行精准的语音输入。

中英文混合语音输入技术,以及方言与方言、方言与普通话的混合语音输入技术突破,让用户真正实现“自由说”,无论是中英文夹杂,还是普通话家乡话来回切换,百度输入法都能准确识别。据介绍,百度输入法是目前唯一实现了高精度“中英自由说”和“方言自由说”的输入法产品。

(发布会主持人张绍刚体验百度输入法“方言自由说”)

百度语音技术的突破同样让海外用户带来语音输入的便捷体验。本次发布会上,百度海外输入法展示了日语识别、印地语识别和印英混输功能,据第三方评测显示,百度日文输入法的语音识别精度位列行业第一,识别结果用户可接受度占比高达 90%,已成为日本最大的第三方输入法产品;印度用户语音功能的使用率已达21%,百度输入法帮助印度用户实现了自由沟通。

(百度海外输入法负责人姜锋)

表情、动作成为输入新方式 全感官交互创造更多想象空间

伴随着百度语音、视觉、自然语言处理、知识图谱等百度AI技术落地输入法,“全感官”的输入变成现实。除了语音输入,百度输入法AI探索版还推出了拍立活、秀场、凌空手写等新功能玩法。无论是心爱的偶像,还是日夜陪伴的宠物,“拍立活”功能都可以让用户通过自己的动作“驱动”对方做出相同表情;“秀场”功能运用图像分割技术,让用户“穿越”到不同的虚拟场景之中,科技、清新、赛博朋克多种风格随意挑选,表情创作更具场景感、更加生活化;凌空手写如同隔空打怪,在空中书写也能被流畅识别,目前整体识别率已达到大规模应用的要求。

(网络红人小吴现场体验百度输入法AR表情)

百度输入法全感官交互潮流也已进入海外并获得认可。据悉,借助AI技术的加持,百度海外输入法已经在全球建立起最活跃、最权威的表情社区。超级IP《变形金刚》系列首部独立电影《大黄蜂》已与百度海外输入法联手推出“大黄蜂”系列主题贴图和AR表情。截止目前,百度海外输入法已经和Hello Kitty、小黄鸭、小王子、格林奇等全球100余个知名IP达成合作,推出了一系列深受用户喜爱的IP皮肤和表情,同时深耕本地化运营,针对海外用户还设计了本地网红合作推广等定制化传播。2018年,百度海外输入法的推广视频,总观看次数已超过1亿。

输入法本质上是一款人机交互的工具,AI时代正在到来,人机交互的形态也将随之革新。“未来,百度输入法将不仅基于手机端,还将致力于连通包括智能家居、车联网等多种终端场景,集多种输入方式为一体,帮助用户在各种场景下高效、自如地传递信息。” 百度高级副总裁王海峰表示。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

中文在线语音识别技术获重大突破!百度输入法准确率超行业最高水平15%相关推荐

  1. 远鉴科技“语音识别”技术获美亚柏科青睐!

    近日,美亚柏科与远鉴科技达成合作,远鉴科技将为美亚柏科提供"语音识别"技术支持,结合双方各自的领域优势,一起深入探索人工智能与大数据结合的科技伊甸园.在如今信息流逐渐进入" ...

  2. 中国LiFi技术获重大突破,速度全球领先

    2015年11月份,爱沙尼亚一家名为Velmenni创业公司表示已经开发出了一种通过可见光实现通讯的超快网络传输技术,其测试所使用的LiFi技术能够以最快1GBps的速度发送数据,这一速度是目前WiF ...

  3. 3d打印人造血管 技术获重大突破

    德国弗朗霍夫激光技术研究所研究人员成功利用3d打印技术制造出人造血管,这一技术突破有望广泛应用在治愈皮肤创伤人工皮肤再造和人造器官等医学领域. 重大事故受伤大面积烧伤或肿瘤切除的病人经常需要对创面皮肤 ...

  4. 日均语音请求量突破10亿次,百度输入法的又一个起点

    文 | 魏启扬 来源 | 智能相对论(ID:aixdlun) 2020年的春节假期因为新冠疫情给所有人来了个措手不及,大量"云"服务被激活,作为在线沟通工具的输入法首当其冲,成为特 ...

  5. AI加持 百度输入法语音识别准确率相对提升15%

    7月3日,在2019百度AI开发者大会上,百度首席技术官王海峰在介绍百度大脑AI技术时谈到百度AI能力应用落地的重要产品之一"百度输入法",截止目前,百度输入法日均语音请求量峰值已 ...

  6. 百度输入法开启AI时代,突破方言、中英文混合识别难题

    电脑在我国普及,第一个急需要解决的问题就是,如何将汉字输入到电脑中,于是产生了汉字输入法.汉字输入法发展至今主流的方式大致可以分为,笔画.拼音.五笔.手写.语音.云输入法. 当前国内输入法存在很多问题 ...

  7. 简要介绍语音识别技术在各领域的应用

    语音识别作为信息技术中一种人机接口的关键技术,具有重要的研究意义和广泛的应用价值.介绍了语音识别技术发展的历程,具体阐述了语音识别概念.基本原理.声学建模方法等基本知识,并对语音识别技术在各领域的应用 ...

  8. 基于stm32f429的手写识别_关注智能手机老年用户:百度输入法手写模型迎来重磅升级...

    智能手机的快速普及让很多人都已经习惯于任何事情都用手机办理,不仅外出买东西.乘坐公共交通可以使用智能手机支付,同时一些与工作.政务相关的事情也可以在智能手机端完成,而社交工具更是让人们几乎已经不再使用 ...

  9. 科大讯飞发布四川话语音识别技术,号称识别准确率超过85%

    如果你实在闲的蛋疼,不妨拿起你的 iPhone 用标准的四川话对 Siri 说,"放心巴适得很绝对正宗 ",当然来自美帝国的 Siri 是不可能听明白四川话的(但她可以听懂粤语.. ...

最新文章

  1. Idea 插件开发常用的方法
  2. python input与返回值-Python 详解基本语法_函数_返回值
  3. myeclispse配置自己的jdk和tomcat
  4. Flink从入门到精通100篇(二十)-跨境电商 Shopee 的实时数仓之路
  5. 《疯狂Java讲义》4
  6. [转载]DB2数据库移植罕见成绩片面理睬(4)
  7. Stream流中间操作方法
  8. 天津科技大学计算机基础,天津科技大学大学计算机基础样卷
  9. mysql not in 转化_解析MySQL隐式转换问题
  10. 如何使用HttpContext对象
  11. android程序内置浏览器,Android 应用程序与浏览器
  12. 【Datawhale第25期组队学习】Task01:异常检测概念和方法
  13. 【Linux云计算架构:第一阶段-Linux操作系统入门到精通】第18章——Linux网络管理技术
  14. 商标设计后一定要向商标局进行重新提交,商标持有公司变更后要及时变更商标
  15. Java 哈密顿距离
  16. mdk ac6 CLANG
  17. 对于等待事件(direct path read)的理解
  18. ROS安装与机器人环境配置总结
  19. 学习笔记之NumPy
  20. c++栈的学习( 括号匹配问题)

热门文章

  1. 正确理解springboot的常用注入方式
  2. java访问微信接口发送消息
  3. 前台传JSON到后台
  4. transform对定位元素的影响
  5. 07-struts2提供的数据校验
  6. Nginx使用Expires增加浏览器缓存加速
  7. jquery------导入jquery.2.2.3.min.js
  8. VMware ESXi 虚拟机硬盘格式:精简置备、厚置备延迟置零、厚置备置零
  9. HDU2016 数据的交换输出【入门】
  10. python opencv —— io(帧、图像、视频的读取与保存)