语音识别，深度学习的个人学习感想.1

本文是学习深度学习之中得到的一些感想
接下来会定期发布，用于和同样有需要的人一起分享
声音的波长->Neural Network->hello
第一步：声音变成位元（声波变成电脑识别的单元）
运用计算机的软体或者硬体把声音转换为位元让电脑可以接受
声音以波浪的方式传播
如你好

转化为声波后就是这样
可以看到每一个你好的过程实际上是可以转化为一个一维的东西来表示

随后就是进行抽样进行上千次的抽样以尽量保证还原性。（实际上就是模拟转数字）
因此，在一个类似于麦克风的输入装置输入语音后，需要先进行预处理
类似语音转声波，模拟转数字然后变成神经网络可以接受的资料输入神经网络。
第二步输入神经网络
把经过预处理的数据输入一个译码器里面，通过加入语言模型和声学模型的辨识得到单词
具体过程：先通过傅里叶变换将声波转换为能量谱
再通过画频谱图等方式对其进行分析

通过递归神经网络，分析其与几个可能的词的相似性。
通过估计每一个字母
实际上这时候得出的还是不太稳定，往往还需要更多一步的处理

程序范例
import speeth_recognition as sr
r=sr.Rescognizer()
运用speech_recognition 包各个公司的API
例如：
recognize_google
recognize_ibm 等等

如果是和cmu sphinx的话可以做脱机工作 offline
其余的只能进行online工作

实例训练1：
音频检验
kkk=sr_Audiofile(‘音频文件’)
audio=r.record(kkk)读入音频
其文件类型为
sppech_recognition.Audiodata
然后使用r.recognize_google(audio)
也可以对文本进行切割
例如把audio分为两段音频

实例训练二
播放音频
import playsound 和simpleaudio as sa
然后
wav_yxx=sa.WaveObject.from_wave_file(‘文件名’)
play_yxx=wav_yxx_play()
play_yxx.wait_done()
可以播放音频

实例训练三
安装pyaudio
import speeth_recognition as sr
r=sr_Recognizer()
mic=sr.microphone()
with mic as source
audio=r.listen(source)
r.recognize_google(audio)
可以进行录音
变成
with mic as source
adjust_for_ambient_noise()
audio=r.listen(source)
可以清除噪音

只需要对recognize进行改变变成
r.recognize_google(audio,language=“zh-tw”)即可识别繁体中文
此为第一次学习的部分经验。之后会继续更新

语音识别，深度学习的个人学习感想.1相关推荐

专访微软邓力：语音识别与非监督深度学习、增强学习、词嵌入、类脑智能
在俞栋接受CSDN专访解读基于深度学习的语音识别技术及CNTK开源软件的同时,<解析深度学习-语音识别实践>一书的另一位作者.微软人工智能首席科学家邓力也接受CSDN专访,以另外的视角诠释 ...
B站上线！DeepMind加UCL强强联手推出深度学习与强化学习进阶课程（附视频）
新智元报道编辑:元子 [新智元导读]DeepMind和伦敦大学学院(University College London,UCL)合作,推出了一个系列的深度学习与强化学习精品进阶课程.该课程内 ...
直播 NO.5 | Facebook 田渊栋：用深度（强化）学习为组合优化寻找更好的启发式搜索策略...
↑↑↑↑↑点击上方蓝色字关注我们! 『运筹OR帷幄』原创对这次分享主题感兴趣的小伙伴, 欢迎在文末留言提问, 我们会收集有价值的问题, 请嘉宾在直播中亲自解答. 分享提纲主题:<用深度(强化 ...
自学机器学习、深度学习、人工智能学习资源推大聚合
想要解决如何自学机器学习.深度学习和人工智能这一问题,首先要了解三个概念以及它们之间的关系. 人工智能:人工智能英文缩写为AI,它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的 ...
斯坦福大学#深度多任务学习与元学习#视频及讲义下载
#Stanford CS330 2019秋# #多任务学习# #元学习# CS 330: Deep Multi-Task and Meta Learning 深度学习在图像分类.语音识别.游戏等监督学 ...
人工智能、机器学习、深度学习、强化学习、迁移学习概念辨析
整体来看:AI>机器学习(ML)>深度学习=强化学习=迁移学习一.人工智能 1956年,计算机科学家 John McCarthy提出了"人工智能"的 ...
机器学习/深度学习几种典型学习范式|主动学习
机器学习/深度学习几种典型学习范式|主动学习主动学习(Active Learning,AL): Introduction 主动学习的例子应用场景成员查询合成流式选择抽样基于池的主动学习查询 ...
语音识别（ASR）-- Kaldi 学习笔记
语音识别(ASR)-- Kaldi学习笔记语音识别简介 GMM-HMM基本原理 DNN-HMM(基于神经网络) Kaldi Kaldi架构简介 Kaldi在Windows下的安装工具准备编译Op ...
【《深度学习入门》—— 学习笔记（二）】
<深度学习入门>-- 学习笔记(二)_5-8章第五章误差反向传播法方法一:基于数学式 - 严密简洁方法二:基于计算图(computational graph) - 直观 5.1 计 ...
《预训练周刊》第39期：深度模型、提示学习
No.39 智源社区预训练组预训练研究观点资源活动周刊订阅告诉大家一个好消息,<预训练周刊>已经开启"订阅功能",以后我们会向您自动推送最新版的&l ...

语音识别，深度学习的个人学习感想.1

语音识别，深度学习的个人学习感想.1相关推荐

最新文章

热门文章