本文是学习深度学习之中得到的一些感想
接下来会定期发布,用于和同样有需要的人一起分享
声音的波长->Neural Network->hello
第一步:声音变成位元(声波变成电脑识别的单元
运用计算机的软体或者硬体把声音转换为位元让电脑可以接受
声音以波浪的方式传播
如你好

转化为声波后就是这样
可以看到每一个你好的过程实际上是可以转化为一个一维的东西来表示

随后就是进行抽样进行上千次的抽样以尽量保证还原性。(实际上就是模拟转数字)
因此,在一个类似于麦克风的输入装置输入语音后,需要先进行预处理
类似语音转声波,模拟转数字然后变成神经网络可以接受的资料输入神经网络。
第二步 输入神经网络
把经过预处理的数据输入一个译码器里面,通过加入语言模型和声学模型的辨识得到单词
具体过程:先通过傅里叶变换将声波转换为能量谱
再通过画频谱图等方式对其进行分析

通过递归神经网络,分析其与几个可能的词的相似性。
通过估计每一个字母
实际上这时候得出的还是不太稳定,往往还需要更多一步的处理

程序范例
import speeth_recognition as sr
r=sr.Rescognizer()
运用speech_recognition 包各个公司的API
例如:
recognize_google
recognize_ibm 等等

如果是和cmu sphinx的话可以做 脱机工作 offline
其余的只能进行online工作

实例训练1:
音频检验
kkk=sr_Audiofile(‘音频文件’)
audio=r.record(kkk)读入音频
其文件类型为
sppech_recognition.Audiodata
然后使用r.recognize_google(audio)
也可以对文本进行切割
例如把audio分为两段音频

实例训练二
播放音频
import playsound 和simpleaudio as sa
然后
wav_yxx=sa.WaveObject.from_wave_file(‘文件名’)
play_yxx=wav_yxx_play()
play_yxx.wait_done()
可以播放音频

实例训练三
安装pyaudio
import speeth_recognition as sr
r=sr_Recognizer()
mic=sr.microphone()
with mic as source
audio=r.listen(source)
r.recognize_google(audio)
可以进行录音
变成
with mic as source
adjust_for_ambient_noise()
audio=r.listen(source)
可以清除噪音

只需要对recognize进行改变变成
r.recognize_google(audio,language=“zh-tw”)即可识别繁体中文
此为第一次学习的部分经验。之后会继续更新

语音识别,深度学习的个人学习感想.1相关推荐

  1. 专访微软邓力:语音识别与非监督深度学习、增强学习、词嵌入、类脑智能

    在俞栋接受CSDN专访解读基于深度学习的语音识别技术及CNTK开源软件的同时,<解析深度学习-语音识别实践>一书的另一位作者.微软人工智能首席科学家邓力也接受CSDN专访,以另外的视角诠释 ...

  2. B站上线!DeepMind加UCL强强联手推出深度学习与强化学习进阶课程(附视频)

      新智元报道   编辑:元子 [新智元导读]DeepMind和伦敦大学学院(University College London,UCL)合作,推出了一个系列的深度学习与强化学习精品进阶课程.该课程内 ...

  3. 直播 NO.5 | Facebook 田渊栋:用深度(强化)学习为组合优化寻找更好的启发式搜索策略...

    ↑↑↑↑↑点击上方蓝色字关注我们! 『运筹OR帷幄』原创 对这次分享主题感兴趣的小伙伴, 欢迎在文末留言提问, 我们会收集有价值的问题, 请嘉宾在直播中亲自解答. 分享提纲 主题:<用深度(强化 ...

  4. 自学机器学习、深度学习、人工智能学习资源推大聚合

    想要解决如何自学机器学习.深度学习和人工智能这一问题,首先要了解三个概念以及它们之间的关系. 人工智能:人工智能英文缩写为AI,它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的 ...

  5. 斯坦福大学#深度多任务学习与元学习#视频及讲义下载

    #Stanford CS330 2019秋# #多任务学习# #元学习# CS 330: Deep Multi-Task and Meta Learning 深度学习在图像分类.语音识别.游戏等监督学 ...

  6. 人工智能、机器学习、深度学习、强化学习、迁移学习概念辨析

    整体来看:AI>机器学习(ML)>深度学习=强化学习=迁移学习 一.人工智能 ​        1956年,计算机科学家 John McCarthy提出了"人工智能"的 ...

  7. 机器学习/深度学习几种典型学习范式|主动学习

    机器学习/深度学习几种典型学习范式|主动学习 主动学习(Active Learning,AL): Introduction 主动学习的例子 应用场景 成员查询合成 流式选择抽样 基于池的主动学习 查询 ...

  8. 语音识别(ASR)-- Kaldi 学习笔记

    语音识别(ASR)-- Kaldi学习笔记 语音识别简介 GMM-HMM基本原理 DNN-HMM(基于神经网络) Kaldi Kaldi架构简介 Kaldi在Windows下的安装 工具准备 编译Op ...

  9. 【《深度学习入门》—— 学习笔记(二)】

    <深度学习入门>-- 学习笔记(二)_5-8章 第五章 误差反向传播法 方法一:基于数学式 - 严密简洁 方法二:基于计算图(computational graph) - 直观 5.1 计 ...

  10. 《预训练周刊》第39期: 深度模型、提示学习

    No.39 智源社区 预训练组 预 训 练 研究 观点 资源 活动 周刊订阅 告诉大家一个好消息,<预训练周刊>已经开启"订阅功能",以后我们会向您自动推送最新版的&l ...

最新文章

  1. 014——数组(十四)array_reduce array_slice array_splice array_sum
  2. 网络慢是带宽不足?优化网络带宽的5个小窍门
  3. SAP Spartacus cms.service.ts getComponentData
  4. [JDK 11] jcmd中的类加载器层次结构详细信息
  5. Win10系列:C#应用控件基础7
  6. redis没有bin目录_分布式缓存 Redis 集群搭建,这里一次性帮你搞定!
  7. mysql的ddl的语句有_Mysql操作之部分DDL语句
  8. Java核心技术-具体的集合
  9. MVVM前后分离轻量级框架应用juicer和doT.js
  10. wireshark使用方法总结
  11. 小学数学应用题:经典题型归纳50题含解析
  12. 2022年N1叉车司机上岗证题目及模拟考试
  13. WLC开机卡在launching....(变砖)
  14. HTML经典绝对定位图片
  15. 7-6 愿天下有情人都是失散多年的兄妹(25 分)
  16. 在VS中怎么用vb画矩形_怎样画颜色绚丽的插画?
  17. 计算机视觉结课论文,计算机视觉与图像识别结课论文教案.doc
  18. 人工智能与智能的异同
  19. B05 - 020、HDFS初体验
  20. ireport4.5在JVM中添加新字体解决方案(Font ‘標楷體‘ is not available to the JVM. See the Javadoc for more details.)

热门文章

  1. 3月22日,30秒知全网,精选7个热点///国内首艘500千瓦氢燃料电池动力船下水​///中航京能光伏REIT正式成立
  2. Python 3.11 镜像
  3. audiotrack android,Android 音视频渲染-AudioTrack 播放
  4. WIFI 功放芯片确定功率大小
  5. APIO2016赛艇
  6. 明代养生专著《遵生八笺》
  7. 插件的开放作用和意义
  8. css布局——行列基础布局
  9. 国家版权局关于对出版和复制境外电子出版物和计算机软件进行著作权授权合同登记和认证的通知
  10. 为什么越来越多的人用集成墙整装?