脸书开源第一个使用卷积神经网络技术的端到端语音识别系统
https://www.toutiao.com/a6639449370913669635/
2018-12-27 07:34:30
脸书发布全新自动语音识别的卷积方法 ,以及开源目前最先进的端到端语音识别系统wav2letter++。这个自动语音识别方法使用卷积神经网络(CNN)进行声音建模和语言建模,再加上脸书一同发布的工具,让其他开发者也能实例出相同的成果。
通常CNN架构比起循环架构(Recurrent Architecture),对于有建模长期相依性的任务更具有竞争力,能够良好执行语言建模、机器翻译和语音合成等工作,而在端到端的语音识别其中,循环架构在声音建模和语言建模上却更为普遍。
而脸书的这项研究,是在端到端语音识别中使用CNN架构,脸书表示,端到端语音识别可以轻松的扩展到多种语言,另外,直接从原始语音学习,则是解决音频品质变化大的好方法。脸书的语音团队现在发布第一个全卷积的语音识别系统,从波型到最后的单词转录为文本,系统的可学习部分,能仅由卷积层组成,而这样的性能则可以与循环架构相当。
另外,脸书还发布了快速且灵活的独立机器学习函数库Flashlight,这是由脸书的语音团队以及Torch和DeepSpeech的开发者共同设计的,能为现代C++进行JIT编译,并针对CPU和GPU后端,实现性能与规模最大化,而Wav2letter++工具则创建于Flashlight之上。
由于高性能框架Wav2letter++能进行快速迭代,因此可以加速研究进展,并方便的对新数据集和任务进行模型优化。脸书发布全新自动语音识别的卷积方法的同时,也同时发布了Flashlight和Wav2letter++开发框架,以实现成果的可重复性。
脸书开源第一个使用卷积神经网络技术的端到端语音识别系统相关推荐
- 【深度学习】基于Torch的Python开源机器学习库PyTorch卷积神经网络
[深度学习]基于Torch的Python开源机器学习库PyTorch卷积神经网络 文章目录 1 CNN概述 2 PyTorch实现步骤2.1 加载数据2.2 CNN模型2.3 训练2.4 可视化训练 ...
- Deeplearnng.AI第四部分第一周、卷积神经网络
文章目录 1.2边缘检测 1.3更多边缘检测内容(More edge detection) 1.4 Padding 1.5 卷积步长(Strided convolutions) 1.6 三维卷积(Co ...
- 了解CNN这一篇就够了:卷积神经网络技术及发展
[新智元导读]深度学习很火,说起深度学习中一个很重要的概念--卷积神经网络(CNN)似乎也人人皆知.不过,CNN究竟是什么,涉及哪些概念,经过如何发展,真正要有逻辑地归纳一遍,估计不少人都说不清.日前 ...
- 卷积神经网络技术及发展
https://blog.csdn.net/qq_36330643/article/details/74936657 摘要 过去几年,深度学习在解决诸如视觉识别.语音识别和自然语言处理等很多问题方面都 ...
- 基于cnn的人脸识别_基于卷积神经网络(CNN)的人脸在线识别系统
微信搜索"AI大道理",选择"置顶"公众号 重磅干货,深入讲解AI大道理 ------ 本设计研究人脸识别技术,基于卷积神经网络构建了一套人脸在线检测识别系统, ...
- 基于深度卷积神经网络的玉米病害实时识别检测系统
Deep Convolutional Neural Network based Detection System for Real-time Corn Plant Disease Recognitio ...
- 干货|详解最新语音识别框架 深度全序列卷积神经网络
原标题:干货|详解最新语音识别框架 深度全序列卷积神经网络 导读:目前最好的语音识别系统采用双向长短时记忆网络(LSTM,LongShort Term Memory),但是,这一系统存在训练复杂度高. ...
- 技术向:一文读懂卷积神经网络
技术向:一文读懂卷积神经网络 技术网络 36大数据(张雨石) · 2015-03-06 05:47 自今年七月份以来,一直在实验室负责卷积神经网络(Convolutional Neural Ne ...
- 【华为云技术分享】干货!!卷积神经网络之LeNet-5迁移实践案例
摘要:LeNet-5是Yann LeCun在1998年设计的用于手写数字识别的卷积神经网络,当年美国大多数银行就是用它来识别支票上面的手写数字的,它是早期卷积神经网络中最有代表性的实验系统之一.可以说 ...
最新文章
- 网络编程试卷选择解析
- ystep jQuery流程、步骤插件
- 构建单层单向RNN网络对MNIST数据集分类
- [js高手之路]深入浅出webpack教程系列9-打包图片(file-loader)用法
- 下沉市场惊现出行小巨头 松果共享电单车日订单破300w
- Hibernate提供的内置标识符生成器
- java第二周学习总结
- 回溯法基本思想_LeetCode--回溯法心得
- 少儿是先学计算机 还是学机器人,机器人学习和少儿编程有什么区别?
- rand()与srand()的简单应用(随机数)
- 机器人布罩_机器人防护罩的主要作用是什么?
- c语言单片机常用函数,C51单片机C语言函数编辑 -单片机-电子工程世界网
- 软件工程期末设计(校园教务系统)
- class with pointer
- 中国塔吊行业投资规划分析及前景预测报告2022-2028年版
- 经纬度格式转换-(互转 度转度分秒 度分秒转度……)
- Linux动态库和静态库
- 松下plcgr7安装序列号_向上一阶段跃进,松下 SZ5/SX2 对比、体验与心得
- Ceph OSD Down
- 小尺寸android 手机推荐,目前最值得买的4款小屏手机, 懂行的人才会买, 小屏爱好者福音!...
热门文章
- suse linux ssh connerc failed
- 牛顿:伸向未知量的利爪
- 他曾创造多门编程语言,还被比尔·盖茨以300万美元挖角
- 以太坊Geth的dev模式的使用过程
- 吴恩达:告别大数据,AI需要高质量小数据!
- 无副作用、效果超越吗啡!用微电极精准管理大脑“疼痛中心”,科学家探索止痛新方法...
- 周志华教授:如何做研究与写论文?(附完整的PPT全文)
- 首颗“机器心”成功植入近四十年后,人造心脏终于又迎来颠覆变革
- 姚班、智班之后,量子信息班在清华成立,姚期智担纲,“致力国家战略需求”!...
- 数据有价——数据资产定价研究初探