总结

目前主流的语音识别方法大多基于深度神经网络,这些方法大体分为两类:
一类是采用一定的神经网络取代传统语音识别方法中的个别模块,如特征提取、声学模型或语言模型等;另一类是基于神经网络实习端到端的语音识别。

展望

未来语音识别领域的研究方向可大致归纳如下:
(1)模型压缩与加速;
(2)数据迁移。在面对小样本数据或复杂问题时,迁移学习是一种有效的方式;
(3)多模态数据融合。对于一些复杂的语音场景,可以利用语音信号和其他信号进行融合,以提高语音识别性能;
(4)多技术融合。当前大多数语音识别算法只关注识别文字内容的正确性,然而许多智能语音交互的应用还未涉及到语义的理解。因此,将语音识别技术结合其他技术也是未来研究方向之一。

语音识别研究综述——阅读笔记4(总结与展望)相关推荐

  1. 语音识别研究综述——阅读笔记3(端到端语音识别、语音识别的难度与热点)

    端到端语音识别 传统语音识别由多个模块组成,彼此独立训练,但各个子模块的训练目标不一致,容易产生误差积累,使得子模块的最优解并不一定是全局最优解. 针对这一问题,提出了端到端语音识别,直接对等式(1) ...

  2. 语音识别研究综述——阅读笔记1

    摘要:语音识别使声音变得"可读", 让计算机能够"听懂"人类的语言并做出反应, 是人工智能实现人机交互的关键技术之一.本文介绍了语音识别的发展历程, 阐述了语音 ...

  3. 深度学习超分辨率综述阅读笔记(翻译)

    深度学习超分辨率综述阅读笔记(翻译) https://arxiv.org/abs/1902.06068 摘要:图像超分辨率(SR)是计算机视觉中增强图像和视频分辨率的一类重要图像处理技术.近几年来,图 ...

  4. SaliencyReview:显著性检测综述阅读笔记

    typora-root-url: images SaliencyReviews 显著性检测论文综述阅读笔记 Author: wbzhang 2020/3/19 E-mail: wbzhang233@1 ...

  5. 《安检违禁品图像生成与评价网络模型研究》阅读笔记

    <安检违禁品图像生成与评价网络模型研究>阅读笔记 一.绪论 1.存在的问题 2.研究内容 二.安检图像数据集构建与预处理 1. 图像采集(实验室X光机) 2.安检X光图像预处理 3.安检X ...

  6. 端到端流式语音识别研究综述——语音识别(论文研读)

    端到端流式语音识别研究综述(2022.09) 摘要: 引言: 1 端到端流式语音识别模型 1.1 可直接实现流式识别的端到端模型 1.2 改进后可实现流式识别的端到端模型 1.2.1 基于单调注意力机 ...

  7. 《A Survey on Deep Learning Technique for Video Segmentation》视频分割综述阅读笔记(翻译)

    <A Survey on Deep Learning Technique for Video Segmentation>视频分割综述阅读笔记(背景部分翻译) 作者:Wenguan Wang ...

  8. 经管文本分析 | 金融学文本大数据挖掘方法与研究进展阅读笔记

    姚加权 张锟澎 罗平 <经济学动态>2020年第4期 沈艳 陈赟 黄卓 <经济学(季刊)> 2019年第4期 前言 本文是刊载于<经济学(季刊)>2019年第4期& ...

  9. 基于深度学习的性格探测综述 阅读笔记

    Recent trends in deep learning based personality detection 目录 Recent trends in deep learning based p ...

最新文章

  1. linux java内存分析_Java内存分析利器MAT使用详解
  2. python怎么读文件后删去空格以行为单位进行排序-文件操作
  3. aspnet登录界面代码_SPA+.NET Core3.1 GitHub第三方授权登录
  4. php.ini mysql扩展_PHP安装mysql.so扩展及相关PHP.ini 配置参数说明
  5. php查找特定字符并替代,php怎样查找替代字符串_后端开发
  6. 面试官:了解二叉树吗,平衡二叉树,红黑树?
  7. 虚拟化运行[OpenStack] VMWare产品介绍
  8. 云+X案例展 | 金融类:青云QingCloud助力泰康人寿云计算演进之路
  9. 计算机视觉(CV)前沿国际国内期刊与会议
  10. 软件实施工程师项目经验(转
  11. redis读数据超时问题查询
  12. 亮度,对比度,饱和度,锐度对最终图像效果的影响
  13. js 实现html网页简繁体切换
  14. 两台windows电脑互相备份
  15. UE5的项目建立及UE5(虚幻引擎5)个人视角移动按键操作及运行项目/day.2
  16. 六石管理学:突然看到两个男同事聊天,预判离职
  17. 共用体和结构体所占内存大小的计算方法
  18. 第九届大唐杯省赛知识点梳理-5G无线技术(35%)
  19. 《液晶显示器和液晶电视维修核心教程》——2.7 光电耦合器
  20. windows远程桌面自动登录

热门文章

  1. COMSOL中电磁场物理场接口中线圈的仿真
  2. SAP QM 取消UD方法
  3. 5款开发手机应用的傻瓜式APP开发工具
  4. 设计模式:工厂设计模式
  5. 日语二级语法汇总(part7/16)
  6. 《硅谷之谜》读书笔记:追求卓越,改变自己
  7. Ubuntu18.04配置、软件安装-搜狗输入法,网易云音乐
  8. Ubuntu修改终端下的语言(中文或英文)
  9. 为永嘉路故店合弛的宣扬口号毛病援用“法租界”做替店址的描述
  10. Java中的新生代和老生代