1.2 智能语音产业应用的现状和挑战

智能语音产业应用,基本上都是从语音控制、语音识别和语音交互作为切入点建立起来的,根据不同的定位和形态,目前主要分为以下4类。

(1)APP类纯软语音应用。如Apple Siri和Microsoft Cortana等,在手机、平板或PC上以软件方式解决操作和聊天等问题,内置各种搜索、问答和对话服务。

(2)软硬一体的语音交互应用。如智能音箱Amazon Echo、智能电视、智能语音空调等应用,语音成为主要交互手段,实现控制和相关内容服务获取。

(3)垂直领域的语音转写应用。如医疗语音病例录入、法律语音转写、语音客服数据分析等,将语音数据进行实时或离线转录,后期做结构化分析。

(4)基于语音识别的口语评测等应用。对用户口语语音进行发音、流利度、韵律等评估,并检测口语发音、语法等错误,帮助用户提升口语水平。

智能语音产业应用,目前还面临着用户普及率、认可度和活跃度不够高的问题,原因是多样的,这些挑战主要包括下面4个方面。

(1)基础技术需要继续改进和完善。特别是复杂应用场景、噪声、口音和专业领域的语音识别稳定性和适应性,是扩大实用范围的关键,更多的是针对具体应用问题进行优化,提高准确度;与此同时,还要提高语义理解和容错能力,减少用户人机交互过程出错的影响。

(2)统一的智能语音交互设计标准和规范。语音是新兴人机交互方式,与传统的触屏交互相比,优势在于表达丰富和快速一键直达的能力;劣势在于不像GUI所见即所得那么直观,还有一定出错率,会给用户造成一定的交互心理障碍。

(3)高集成度的智能语音交互方案。除了手机、平板之外,智能设备普遍没有录音功能,降噪更难解决,开发者对语音相关引擎的优势、局限理解不清晰,加上用户对语音交互的认知还缺乏统一规范,高集成度的智能语音交互方案,对快速落地就特别重要。

(4)标准和开放的内容和服务接口。智能语音交互方案,解决的是用户以更加快捷和自然的方式获取内容服务的问题,但内容和服务本身,需要针对智能语音交互方式进行优化,是一个重要的问题。

中国人工智能学会通讯——智能语音技术与产业应用展望 1.2 智能语音产业应用的现状和挑战...相关推荐

  1. 中国人工智能学会通讯——机器人组件技术在智能制造系统中的应用

    摘要:随着工业4.0时代的到来,如何将传统工厂改造成为个性化.网络化.柔性生产的智能制造系统成为了当前的研究热点.本文从智能制造系统和智能机器人系统的相似性出发,构建了基于机器人组件技术的智能制造系统 ...

  2. 《中国人工智能学会通讯》——9.21 基于任务规划的资源卫星智能管控模式

    9.21 基于任务规划的资源卫星智能管控模式 我国目前已建成包括高分.遥感.环境减灾.测绘和试验等多系列资源卫星系统,在轨运行的卫星 20 多颗.随着成像卫星的发展,成像卫星任务规划问题也逐渐引起重视 ...

  3. 中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )...

    到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它 ...

  4. 中国人工智能学会通讯——基于视频的行为识别技术 1.7 视频的深度分段网络...

    1.7 视频的深度分段网络 下面介绍另外一个工作,是我们和 CUHK.ETH 联合开展的,这个工作考 虑视频的分段特性,我们知道视频可以分 成很多段,每一段有不同的内容.我们 开发了一个深度模型,对不 ...

  5. 中国人工智能学会通讯——智能系统测评:挑战和机遇

    上面的四个报告从四个维度讨论了智能系统测评的不同方面--产业.基础.基础和伦理.我受中国人工智能学会的委托,组织这次分论坛,为此对这个领域做了一些调研和思考,从现状和挑战这两个方面做了一些初步总结. ...

  6. 中国人工智能学会通讯——深蓝、沃森与AlphaGo

    在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深 ...

  7. 《中国人工智能学会通讯》——1.28 智能助手背后的技术

    1.28 智能助手背后的技术 呈现在人们眼前的智能助手几乎都是"小而美"的,但其背后却是一个十分复杂的系统,需要多种技术的集成和联动.本文将智能助手背后的技术归为四类,分别是需求理 ...

  8. 《中国人工智能学会通讯》——2.2 智能汽车人机交互与人机协同技术

    2.2 智能汽车人机交互与人机协同技术 作为应用最广.保有量最大的现代交通工具,汽车在极大地方便人类生活的同时也带来了大量问题,如交通事故.交通拥堵和环境污染等.每年发生的道路交通事故给人们的生命和财 ...

  9. 《中国人工智能学会通讯》——2.5 智能汽车人机交互与人机协同技术 的研究进展...

    2.5 智能汽车人机交互与人机协同技术 的研究进展 汽车车载人机交互系统是信息化技术发展的产物,实现了人与车之间的对话功能.驾驶员可通过该系统,掌握车辆状态信息(车速.里程.当前位置.车辆保养信息等) ...

最新文章

  1. 成功解决TypeError: sequence item 0: expected str instance, list found
  2. 直播 | ACL 2021论文解读:低资源语言场景下的跨语言文本摘要
  3. Gartner 企业级网络设备市场份额报告:阿里云负载均衡增速全球第一
  4. 在csdn中输入公式的方法
  5. 数据结构思维 第九章 `Map`接口
  6. svn:Cannot negotiate authentication mechanism
  7. python中breakpoint什么意思_it/breakpoint是什么意思
  8. Corel Painter 2022 for Mac(初学者可驾驭的绘画软件)
  9. 航测无人机测绘地理信息免费资料
  10. centos6.5安装自动化工具ansible和图形化工具tower
  11. unifex:C++现代异步模型先导
  12. 【四二学堂】基于unicloud的跨平台项目-华夏画苑APP
  13. 浅析DNS劫持和HTTP劫持
  14. FATAL: Failed to start gitlab-runner: “systemctl“ failed: exit status 5, Failed to start gitlab-runn
  15. HTML与Java组合使用_【自学java笔记#第五十四天#】javaweb day02 html和css的组合使用...
  16. 日文windows系统 oracle数据库乱码的处理
  17. VMware虚拟机三种网络模式详解与配置
  18. 复现ReDet RTX 3090 pytorch1.8.1
  19. YOLOv4---(详解各种trick)
  20. 曾辉机器人_工业机器人论文范文

热门文章

  1. setTimeOut()和setInterval()的用法
  2. php设置背景图片的代码,css设置背景图片如何实现?(代码实例)
  3. oracle中set怎么用,sqlplus命令格式以及sqlplus中set的用法与解释-Oracle
  4. linux字符串转为二进制,Linux printf将十进制转换为二进制?
  5. python各个绘图的作用,深度讲解Python四大常用绘图库的“绘图原理”
  6. 网件r4500刷第三方固件_网件R6800刷PandoraBox固件,激发潜在的160MHz频宽
  7. CentOS 6.2 下samba 服务的配置
  8. GOROOT、GOPATH
  9. c语言表达式的后缀,中缀表达式转换成后缀表达式C语言程序(一)
  10. php匹配ubb,将php实现过滤UBB代码