语音识别技术的研究难点以及未来发展方向
(文章来源:钛媒体)
目前,语音识别研究工作进展缓慢,困难具体表现在:
(1)输入无法标准统一,比如各地方言的差异,每个人独有的发音习惯等,如下图所示,口腔中元音随着舌头部位的不同可以发出多种音调,如果组合变化多端的辅音,可以产生大量的、相似的发音,这对语音识别提出了挑战。除去口音参差不齐,输入设备不统一也导致了语音输入的不标准。
(2)噪声的困扰,噪声环境的各类声源处理是目前公认的技术难题,机器无法从各层次的背景噪音中分辨出人声,而且,背景噪声千差万别,训练的情况也不能完全匹配真实环境。因而,语音识别在噪声中比在安静的环境下要难得多。
目前主流的技术思路是,通过算法提升降低误差。首先,在收集的原始语音中,提取抗噪性较高的语音特征。然后,在模型训练的时候,结合噪声处理算法训练语音模型,使模型在噪声环境里的鲁棒性较高。最后,在语音解码的过程中进行多重选择,从而提高语音识别在噪声环境中的准确率。完全消除噪声的干扰,目前而言,还停留在理论层面。
(3)模型的有效性,识别系统中的语言模型、词法模型在大词汇量、连续语音识别中还不能完全正确的发挥作用,需要有效地结合语言学、心理学及生理学等其他学科的知识。并且,语音识别系统从实验室演示系统向商品的转化过程中还有许多具体细节技术问题需要解决。
许多用户已经能享受到语音识别技术带来的方便,比如智能手机的语音操作等。但是,这与实现真正的人机交流还有相当遥远的距离。目前,计算机对用户语音的识别程度不高,人机交互上还存在一定的问题,智能语音识别系统技术还有很长的一段路要走,必须取得突破性的进展,才能做到更好的商业应用,这也是未来语音识别技术的发展方向。
在语音识别的商业化落地中,需要内容、算法等各个方面的协同支撑,但是良好的用户体验是商业应用的第一要素,而识别算法是提升用户体验的核心因素。目前语音识别在智能家居、智能车载、智能客服机器人方面有广泛的应用,未来将会深入到学习、生活、工作的各个环节。许多科幻片中的场景正在逐步走入我们的平常生活。
(责任编辑:fqj)
打开APP精彩内容
点击阅读全文
语音识别技术的研究难点以及未来发展方向相关推荐
- 北邮石川教授:「异质信息网络」研究现状及未来发展
本文转载自:https://www.leiphone.com/news/201801/MpY4WF11OTnFLp7y.html 图片均来源于转载地址 异质信息网络研究现状及未来发展 一.引言 现实生 ...
- 我对前端技术更新的看法以及未来发展趋势预测
我对前端技术更新的看法以及未来发展趋势预测 前端开发如何看待"别更新了,学不动了"?Deno.TypeScript 等新轮子层出不穷,未来前端重点方向在哪?前端开发在大前端浪潮下如 ...
- 计算光学和计算机科学与技术,光学计算会是未来发展方向吗?
原标题:光学计算会是未来发展方向吗? 多年以前,"计算(computing)"只属于模拟电路领域.它们不能把多列数字累加起来,却可以求解复杂的微分方程式和其他方程序.一旦透过手动增 ...
- 手机已经代替钱包?移动支付技术的应用趋势及未来发展
移动支付已经成为了我们日常生活中不可或缺的一部分,无论是支付宝.微信支付.还是Apple Pay,这些移动支付工具已经取代了传统的纸币和硬币,成为了现代化支付的代表.移动支付技术的应用不仅仅是方便了我 ...
- 智能合约在区块链溯源技术中的应用及未来发展:提升企业运营效率
作者:禅与计算机程序设计艺术 智能合约在区块链溯源技术中的应用及未来发展:提升企业运营效率 引言 随着互联网.物联网.区块链等技术的快速发展,企业运营效率也逐渐有了很大的提高.特别是在区块链技术的作用 ...
- 人工智能已到瓶颈! AI未来发展方向
AI泰斗张钹:AI最重要的能力是知识,而不是数据 阿尔法狗打败围棋高手.索菲亚任你问答.无人车陆续量产,人工智能正日益为人类社会带来不可思议的改变.人工智能一方面在不断挑战人类的想象力,一方面又显得十 ...
- 音视频领域的未来发展方向展望
文章目录 音视频领域的未来发展方向 全景音视频技术 虚拟现实和增强现实的区别 人工智能技术 可视化智能分析 智能语音交互 图像识别和视频分析技术 语音处理 智能推荐技术 远程实时通信 流媒体技术未来方 ...
- 全球及中国汽车物流行业未来发展方向与投资机遇研究报告2022版
全球及中国汽车物流行业未来发展方向与投资机遇研究报告2022版 --------------------------------------------- [修订日期]:2021年11月 [搜索鸿晟 ...
- 技术人该如何选择未来职业方向?一起听听这几位美团同学的故事
2021年还有不到两个月结束,如果你回头去看过去的这两年,不难发现中国科技互联网的潮流走向发生了巨变,用数字化技术改造物理世界.助力实体经济,已经成为一种格外重要的能力. 越是潮水方向改变时,选择越是 ...
最新文章
- 一套外企的数据库设计面试题
- Heinz College of Information Systems and Public Policy Carnegie Mellon University
- Java数组对象的内存布局
- python3获取两个日期之间所有日期,以及比较大小
- markdown显示箭头方法
- Ubuntu 16.04粘贴板增强工具Diodon
- spring.net与OracleODP结合时发生的版本问题
- 入门需掌握的20个python代码
- World Wind Java 系列
- qt.qpa.plugin: Could not load the Qt platform plugin “xcb“ in问题
- 【游戏编程扯淡精粹】程序员的Windows技巧
- iOS 生成证书、描述文件、打包上架Appstore详细流程
- 程序员发布:一张图读懂支撑阿里双十一1682亿的技术架构体系
- 【初识Unity】UI游戏:看看你能答对几题?(游戏可下载)
- 幼儿园观察记录的目的和目标_幼儿园一日观察报告
- JavaScript-Tool:Moment.js
- 计算机设计大赛作品信息概要表模板
- 应用与系统稳定性第五篇---Watchdog原理和问题分析
- 都在发做圣诞树,我来点不一样的,用python给对象戴一顶圣诞帽
- 6.0.高等数学四-多元复合函数的偏导数