Speaker Recognition: Gaussian probabilistic LDA (PLDA)理解
"MSR Identity Toolbox"里使用到了G-PLDA(Gaussian probabilistic LDA)。
根据文献[1]对G-PLDA的原理进行了初步的了解,记录如下。
1. 简化版的G-PLDA的模型定义如公式(3)。
这里 是观察向量,m是均值, 是说话人特征子空间矩阵, 是说话人隐变量, 是残差高斯噪声。
2. 根据文献[1],loglikelihood ratio for this hypothesis test定义如下。分子是假定 是同一说话人,分母则是假定是不同说话人。
要理解公式(4)可参考PLDA的原始论文(参考文献[2])中的Figure 2 B. 现截图如下。
M0是说x1和xp分别来自不同人h1和h2,而M1是说x1和xp来自同一个人h1。
3. 根据另一个参考文献,公式(4)可以推导如下:
以上式子中的分母对应的是边缘分布p(w1)和p(w2)的乘积,分子则是边缘分布p(w1,w2)。
由于w1,w2都是高斯分布,因此根据参考[1]不难得出以下推导,第1项是p(w1,w2),第2项是p(w1)和p(w2)。
参考:
[1] Analysis of I-vector Length Normalization in Speaker Recognition Systems
[2] Probabilistic Linear Discriminant Analysis for Inferences About Identity
Speaker Recognition: Gaussian probabilistic LDA (PLDA)理解相关推荐
- END-TO-END DNN BASED SPEAKER RECOGNITION INSPIRED BY I-VECTOR AND PLDA
END-TO-END DNN BASED SPEAKER RECOGNITION INSPIRED BY I-VECTOR AND PLDA Johan Rohdin, Anna Silnova, M ...
- 【论文学习】《Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems》
<Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems>论文学习 文章目录 <Who is Real ...
- Within-sample variability-invariant loss for robust speaker recognition under noisy environments
Within-sample variability-invariant loss for robust speaker recognition under noisy environments 标题: ...
- ICASSP 2019----Analysis and Mitigation of Vocal Effort Variations in Speaker Recognition
Mahesh Kumar Nandwana1 , Mitchell McLaren1 , Luciana Ferrer2 , Diego Castan1 , Aaron Lawson1 1,Speec ...
- Speaker Recognition: Feature Extraction
1. Short-Term Spectral Features 常用的有MFCC, LPCC, LSF, PLP.实际应用中,如何选择哪个特征参数,重要性不如如何做好channel compensat ...
- Speaker Recognition: GMM-UBM
1. WHY --- 为什么需要使用GMM-UBM来建立Individual Speaker Modeling? "Usually, we do not have much data fro ...
- 说话人识别(speaker Recognition/Verification)简介
1.分类 2.研究方向 说话人识别研究方向主要有三个: 语音信号参数化:即提取音频特征spectral features,目前主流研究都采用MFCCs系数,以及其Δ和ΔΔ系数(即时间上的一阶导数和二阶 ...
- voxsrc20_std_00-How many kinds of topology used in speaker recognition?
ID = voxsrc20_std_00 Status: closed Content Topic Study record [200711] VoxSRC19 Reference Topic How ...
- 论文学习:Practical Adversarial Attacks Against Speaker Recognition Systems
文章题目:Practical Adversarial Attacks Against Speaker Recognition Systems 来源:ACM HotMobile 2020 链接:http ...
最新文章
- 一学即懂得计算机视觉
- 10版微机监测怎么显示服务器,铁路信号网络版微机监测系统的研究
- Docker(四):Docker 三剑客之 Docker Compose
- R学习_multitaper包解析1:子函数centre,dpss
- mysql数据库连接6_c# – 实体框架的动态MySQL数据库连接6
- python正则表达
- 安卓初学者必看实例,(手机GPS简单编程访问)
- 匿名函数 lambda
- Java RMI远程方法调用学习总结
- python实现sql盲注
- 怎样用java抽签小程序,可以作弊的抽签小程序,急求java抽签小程序
- 编程算法题:101个数字,[1,100]中有一个是重复的,找出这个重复的数字。
- android实现截图功能吗,android截屏功能实现代码
- PR预设:100种缩放旋转移动摇晃变形分割转场预设Transitions Pro for win/Mac​
- 基于CNN的人脸 性别、年龄识别
- cv岗工作做什么_成为一个CV之前都需要做一些什么准备工作?
- word字号选项设置为中文字号
- 抽象函数(Java)
- python获取文件换行符_python – 读取文件没有换行符
- 1 求长方形的面积和周长
热门文章
- WebResponse 跨域访问
- 经典水晶报表设计三则
- Q103:磨边的物体(Beveled Objects)
- 问题六十七:ray tracing学习总结(2016.11.13, 2017.02.05)
- 机器学习-决策树(ID3、C4.5、CART)
- 企业如何选择数据可视化工具
- java命令行参数args_Args4J (Java 命令行参数控制开源项目) 使用指南
- python3生成验证码_Python3实现生成验证码图片
- Springboot连接不上mysql8_springboot连接mysql8.0问题解决
- AcWing 1913. 公平摄影(前缀和+STL)