语音识别中,为了增强音频特征的鲁棒性,需要提取区分能力较强的特征向量,常用的方法是PCA和LDA算法。

PCA算法寻找,保留数据中最有效的,最重要的成分,舍去一些冗余的,包含信息量减少的成分。

LDA算法是通过一个变化矩阵来达到降维的目的,LDA与PCA不同之处在于,LDA使得样本内的分布凝聚,使得样本间的分布疏远,这样的特征更加有代表性,在分类里面LDA算法更优。

如下图所示:

LDA有如下假设:

1)特征向量投影后不是所有的维都包含具有区分力的信息,他们都被包含在前P维子空间,而后(n-p)维子空间不包含有用的信息而被忽略;

2)每个样本内都是高斯分布。

公式定义如下:

当语音特征用向量表示时,LDA算法希望模式样本间的协方差矩阵Sb越大越好,

而样本内的协方差矩阵Sw越小越好,因此上式中使得Wopt取最大值。

投影矩阵的列向量为:d个最大特征值(矩阵的特征向量)所对应的特征向量

经过LDA变换后的协方差矩阵不能对角化,因此需要经过MLLT(MaximumLikelihood Linear Transformation, MLLT )进行变换。

MLLT算法的介绍会在下一篇文章详细介绍。

声学模型训练-LDA算法相关推荐

  1. NLP之TM之LDA:利用LDA算法瞬时掌握文档的主题内容—利用希拉里邮件数据集训练LDA模型并对新文本进行主题分类

    NLP之TM之LDA:利用LDA算法瞬时掌握文档的主题内容-利用希拉里邮件数据集训练LDA模型并对新文本进行主题分类 目录 输出结果 设计思路 核心代码 训练数据集 LDA模型应用 输出结果 设计思路 ...

  2. 独家 | 利用Python实现主题建模和LDA 算法(附链接)

    作者:Susan Li翻译:陈之炎校对:陈汉青本文约1900字,建议阅读5分钟在这篇文章,我们将LDA应用于一组文档,并将文档按照主题分类. 标签:LDA 算法 主题建模是一种用于找出文档集合中抽象& ...

  3. 【NLP基础】NLP关键字提取技术之LDA算法原理与实践

    点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要11分钟 跟随小博主,每天进步一丢丢 引文 人们是如何从大量文本资料中便捷得浏览和获取信息?答案你肯定会说通过关键字.仔细想想,我们人类是怎么提 ...

  4. R语言之LDA算法应用

    在R语言中我们用LDA算法的做预测的时候包,主要的MASS包.在这里我就不对于LDA算法进行详细的描述,只是根据问题的需求用R语言解决问题.我们使用的数据是KKNN包中的自带数据miete数据.主要对 ...

  5. 【机器学习】LDA算法原理

    问题 线性判别分析(Linear Discriminant Analysis,LDA)是机器学习中常用的降维方法之一,本文旨在介绍LDA算法的思想,其数学推导过程可能会稍作简化. LDA的思想 ● L ...

  6. python建模大赛算法_利用Python实现主题建模和LDA 算法(附链接)

    主题建模是一种用于找出文档集合中抽象"主题"的统计模型.LDA(Latent Dirichlet Allocation)是主题模型的一个示例,用于将文档中的文本分类为特定的主题.L ...

  7. 深度学习入门,一文讲解神经网络的构成、训练和算法

    小白深度学习入门系列 神经网络的构成.训练和算法 什么是神经网络 人工神经网络(Artificial Neural Network,ANN),简称神经网络(Neural Network,NN),是一种 ...

  8. 【深度学习】快照集成等网络训练优化算法系列

    [深度学习]快照集成等网络训练优化算法系列 文章目录 1 什么是快照集成? 2 什么是余弦退火学习率? 3 权重空间中的解决方案 4 局部与全局最优解 5 特别数据增强 6 机器学习中解决数据不平衡问 ...

  9. EL之Bagging(DTR):利用DIY数据集(预留30%数据+两种树深)训练Bagging算法(DTR)

    EL之Bagging(DTR):利用DIY数据集(预留30%数据+两种树深)训练Bagging算法(DTR) 目录 输出结果 设计思路 核心代码 输出结果 1.treeDepth=1 2.treeDe ...

  10. FE之DR之线性降维:PCA/白化、LDA算法的数学知识(协方差矩阵)、相关论文、算法骤、代码实现、案例应用等相关配图之详细攻略

    FE之DR之线性降维:PCA/白化.LDA算法的数学知识(协方差矩阵).相关论文.算法骤.代码实现.案例应用等相关配图之详细攻略 目录 PCA 1.PCA的数学知识 1.协方差矩阵计算 2.PCA算法 ...

最新文章

  1. win7安装omnetpp-4.6
  2. 《UNIX环境高级编程(第3版)》——1.7 出错处理
  3. c语言不允许对数组的大小做动态定义,数组,C语言程序设计课件,与中南大学出版社教材相配套.ppt...
  4. 一文带你马上清楚bootstrap的栅格系统
  5. iOS程序启动原理(上)
  6. linux ubuntu系统安装及卸载oracle xe11.2.0
  7. r语言怎么把txt数据变成一个Rdata格式_甲基化芯片数据下载如何读入到R里面
  8. RabbitMQ生产者和消费者Java实现
  9. java frameview_Java FrameLayout.removeView方法代码示例
  10. 【转】完美解除Windows7的驱动程序强制签名限制
  11. Android开发遇到的问题
  12. 什么才是真正的项目团队,我来告诉你需要做哪些
  13. 【知识点总结】电路原理 第一讲
  14. Java设计模式及实践
  15. FAT32学习笔记(五)——fat相关工具
  16. Oracle 锁表查询
  17. 产品创新案例分析|大疆如何从初创到无人机帝国的进阶之路
  18. 今日头条推出“悟空问答” 做智能问答分发先驱者
  19. 如何使计算机每隔X秒按一次键
  20. 2021-2025年中国脱水泵行业市场供需与战略研究报告

热门文章

  1. 关于OSPF区域划分
  2. Idea 设置Eclipse快捷键
  3. fastlane实现Android自动化打包
  4. 之前用Delphi随手写的软键盘SoftKeyBoard
  5. python 爬取movie时光网
  6. CVPR'22 | 基于可形变关键点模型的图像驱动技术
  7. Unity IOS包在IPhone出现闪退
  8. C++求一元二次方程根
  9. 2020最新版前端学习路线图--Javascript网页编程重点知识
  10. Centos Linux破解开机密码