中国人工智能学会通讯——智能语音技术与产业应用展望 1.2 智能语音产业应用的现状和挑战...
1.2 智能语音产业应用的现状和挑战
智能语音产业应用,基本上都是从语音控制、语音识别和语音交互作为切入点建立起来的,根据不同的定位和形态,目前主要分为以下4类。
(1)APP类纯软语音应用。如Apple Siri和Microsoft Cortana等,在手机、平板或PC上以软件方式解决操作和聊天等问题,内置各种搜索、问答和对话服务。
(2)软硬一体的语音交互应用。如智能音箱Amazon Echo、智能电视、智能语音空调等应用,语音成为主要交互手段,实现控制和相关内容服务获取。
(3)垂直领域的语音转写应用。如医疗语音病例录入、法律语音转写、语音客服数据分析等,将语音数据进行实时或离线转录,后期做结构化分析。
(4)基于语音识别的口语评测等应用。对用户口语语音进行发音、流利度、韵律等评估,并检测口语发音、语法等错误,帮助用户提升口语水平。
智能语音产业应用,目前还面临着用户普及率、认可度和活跃度不够高的问题,原因是多样的,这些挑战主要包括下面4个方面。
(1)基础技术需要继续改进和完善。特别是复杂应用场景、噪声、口音和专业领域的语音识别稳定性和适应性,是扩大实用范围的关键,更多的是针对具体应用问题进行优化,提高准确度;与此同时,还要提高语义理解和容错能力,减少用户人机交互过程出错的影响。
(2)统一的智能语音交互设计标准和规范。语音是新兴人机交互方式,与传统的触屏交互相比,优势在于表达丰富和快速一键直达的能力;劣势在于不像GUI所见即所得那么直观,还有一定出错率,会给用户造成一定的交互心理障碍。
(3)高集成度的智能语音交互方案。除了手机、平板之外,智能设备普遍没有录音功能,降噪更难解决,开发者对语音相关引擎的优势、局限理解不清晰,加上用户对语音交互的认知还缺乏统一规范,高集成度的智能语音交互方案,对快速落地就特别重要。
(4)标准和开放的内容和服务接口。智能语音交互方案,解决的是用户以更加快捷和自然的方式获取内容服务的问题,但内容和服务本身,需要针对智能语音交互方式进行优化,是一个重要的问题。
中国人工智能学会通讯——智能语音技术与产业应用展望 1.2 智能语音产业应用的现状和挑战...相关推荐
- 中国人工智能学会通讯——机器人组件技术在智能制造系统中的应用
摘要:随着工业4.0时代的到来,如何将传统工厂改造成为个性化.网络化.柔性生产的智能制造系统成为了当前的研究热点.本文从智能制造系统和智能机器人系统的相似性出发,构建了基于机器人组件技术的智能制造系统 ...
- 《中国人工智能学会通讯》——9.21 基于任务规划的资源卫星智能管控模式
9.21 基于任务规划的资源卫星智能管控模式 我国目前已建成包括高分.遥感.环境减灾.测绘和试验等多系列资源卫星系统,在轨运行的卫星 20 多颗.随着成像卫星的发展,成像卫星任务规划问题也逐渐引起重视 ...
- 中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )...
到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它 ...
- 中国人工智能学会通讯——基于视频的行为识别技术 1.7 视频的深度分段网络...
1.7 视频的深度分段网络 下面介绍另外一个工作,是我们和 CUHK.ETH 联合开展的,这个工作考 虑视频的分段特性,我们知道视频可以分 成很多段,每一段有不同的内容.我们 开发了一个深度模型,对不 ...
- 中国人工智能学会通讯——智能系统测评:挑战和机遇
上面的四个报告从四个维度讨论了智能系统测评的不同方面--产业.基础.基础和伦理.我受中国人工智能学会的委托,组织这次分论坛,为此对这个领域做了一些调研和思考,从现状和挑战这两个方面做了一些初步总结. ...
- 中国人工智能学会通讯——深蓝、沃森与AlphaGo
在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深 ...
- 《中国人工智能学会通讯》——1.28 智能助手背后的技术
1.28 智能助手背后的技术 呈现在人们眼前的智能助手几乎都是"小而美"的,但其背后却是一个十分复杂的系统,需要多种技术的集成和联动.本文将智能助手背后的技术归为四类,分别是需求理 ...
- 《中国人工智能学会通讯》——2.2 智能汽车人机交互与人机协同技术
2.2 智能汽车人机交互与人机协同技术 作为应用最广.保有量最大的现代交通工具,汽车在极大地方便人类生活的同时也带来了大量问题,如交通事故.交通拥堵和环境污染等.每年发生的道路交通事故给人们的生命和财 ...
- 《中国人工智能学会通讯》——2.5 智能汽车人机交互与人机协同技术 的研究进展...
2.5 智能汽车人机交互与人机协同技术 的研究进展 汽车车载人机交互系统是信息化技术发展的产物,实现了人与车之间的对话功能.驾驶员可通过该系统,掌握车辆状态信息(车速.里程.当前位置.车辆保养信息等) ...
最新文章
- 成功解决TypeError: sequence item 0: expected str instance, list found
- 直播 | ACL 2021论文解读:低资源语言场景下的跨语言文本摘要
- Gartner 企业级网络设备市场份额报告:阿里云负载均衡增速全球第一
- 在csdn中输入公式的方法
- 数据结构思维 第九章 `Map`接口
- svn:Cannot negotiate authentication mechanism
- python中breakpoint什么意思_it/breakpoint是什么意思
- Corel Painter 2022 for Mac(初学者可驾驭的绘画软件)
- 航测无人机测绘地理信息免费资料
- centos6.5安装自动化工具ansible和图形化工具tower
- unifex:C++现代异步模型先导
- 【四二学堂】基于unicloud的跨平台项目-华夏画苑APP
- 浅析DNS劫持和HTTP劫持
- FATAL: Failed to start gitlab-runner: “systemctl“ failed: exit status 5, Failed to start gitlab-runn
- HTML与Java组合使用_【自学java笔记#第五十四天#】javaweb day02 html和css的组合使用...
- 日文windows系统 oracle数据库乱码的处理
- VMware虚拟机三种网络模式详解与配置
- 复现ReDet RTX 3090 pytorch1.8.1
- YOLOv4---(详解各种trick)
- 曾辉机器人_工业机器人论文范文
热门文章
- setTimeOut()和setInterval()的用法
- php设置背景图片的代码,css设置背景图片如何实现?(代码实例)
- oracle中set怎么用,sqlplus命令格式以及sqlplus中set的用法与解释-Oracle
- linux字符串转为二进制,Linux printf将十进制转换为二进制?
- python各个绘图的作用,深度讲解Python四大常用绘图库的“绘图原理”
- 网件r4500刷第三方固件_网件R6800刷PandoraBox固件,激发潜在的160MHz频宽
- CentOS 6.2 下samba 服务的配置
- GOROOT、GOPATH
- c语言表达式的后缀,中缀表达式转换成后缀表达式C语言程序(一)
- php匹配ubb,将php实现过滤UBB代码