"MSR Identity Toolbox"里使用到了G-PLDA(Gaussian probabilistic LDA)。

根据文献[1]对G-PLDA的原理进行了初步的了解,记录如下。

1. 简化版的G-PLDA的模型定义如公式(3)。

这里 是观察向量,m是均值, 是说话人特征子空间矩阵, 是说话人隐变量, 是残差高斯噪声。

2. 根据文献[1],loglikelihood ratio for this hypothesis test定义如下。分子是假定 是同一说话人,分母则是假定是不同说话人。

要理解公式(4)可参考PLDA的原始论文(参考文献[2])中的Figure 2 B. 现截图如下。

M0是说x1和xp分别来自不同人h1和h2,而M1是说x1和xp来自同一个人h1。

3. 根据另一个参考文献,公式(4)可以推导如下:

以上式子中的分母对应的是边缘分布p(w1)和p(w2)的乘积,分子则是边缘分布p(w1,w2)。

由于w1,w2都是高斯分布,因此根据参考[1]不难得出以下推导,第1项是p(w1,w2),第2项是p(w1)和p(w2)。

参考:

[1] Analysis of I-vector Length Normalization in Speaker Recognition Systems

[2] Probabilistic Linear Discriminant Analysis for Inferences About Identity

Speaker Recognition: Gaussian probabilistic LDA (PLDA)理解相关推荐

  1. END-TO-END DNN BASED SPEAKER RECOGNITION INSPIRED BY I-VECTOR AND PLDA

    END-TO-END DNN BASED SPEAKER RECOGNITION INSPIRED BY I-VECTOR AND PLDA Johan Rohdin, Anna Silnova, M ...

  2. 【论文学习】《Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems》

    <Who is Real Bob? Adversarial Attacks on Speaker Recognition Systems>论文学习 文章目录 <Who is Real ...

  3. Within-sample variability-invariant loss for robust speaker recognition under noisy environments

    Within-sample variability-invariant loss for robust speaker recognition under noisy environments 标题: ...

  4. ICASSP 2019----Analysis and Mitigation of Vocal Effort Variations in Speaker Recognition

    Mahesh Kumar Nandwana1 , Mitchell McLaren1 , Luciana Ferrer2 , Diego Castan1 , Aaron Lawson1 1,Speec ...

  5. Speaker Recognition: Feature Extraction

    1. Short-Term Spectral Features 常用的有MFCC, LPCC, LSF, PLP.实际应用中,如何选择哪个特征参数,重要性不如如何做好channel compensat ...

  6. Speaker Recognition: GMM-UBM

    1. WHY --- 为什么需要使用GMM-UBM来建立Individual Speaker Modeling? "Usually, we do not have much data fro ...

  7. 说话人识别(speaker Recognition/Verification)简介

    1.分类 2.研究方向 说话人识别研究方向主要有三个: 语音信号参数化:即提取音频特征spectral features,目前主流研究都采用MFCCs系数,以及其Δ和ΔΔ系数(即时间上的一阶导数和二阶 ...

  8. voxsrc20_std_00-How many kinds of topology used in speaker recognition?

    ID = voxsrc20_std_00 Status: closed Content Topic Study record [200711] VoxSRC19 Reference Topic How ...

  9. 论文学习:Practical Adversarial Attacks Against Speaker Recognition Systems

    文章题目:Practical Adversarial Attacks Against Speaker Recognition Systems 来源:ACM HotMobile 2020 链接:http ...

最新文章

  1. 一学即懂得计算机视觉
  2. 10版微机监测怎么显示服务器,铁路信号网络版微机监测系统的研究
  3. Docker(四):Docker 三剑客之 Docker Compose
  4. R学习_multitaper包解析1:子函数centre,dpss
  5. mysql数据库连接6_c# – 实体框架的动态MySQL数据库连接6
  6. python正则表达
  7. 安卓初学者必看实例,(手机GPS简单编程访问)
  8. 匿名函数 lambda
  9. Java RMI远程方法调用学习总结
  10. python实现sql盲注
  11. 怎样用java抽签小程序,可以作弊的抽签小程序,急求java抽签小程序
  12. 编程算法题:101个数字,[1,100]中有一个是重复的,找出这个重复的数字。
  13. android实现截图功能吗,android截屏功能实现代码
  14. PR预设:100种缩放旋转移动摇晃变形分割转场预设Transitions Pro for win/Mac​
  15. 基于CNN的人脸 性别、年龄识别
  16. cv岗工作做什么_成为一个CV之前都需要做一些什么准备工作?
  17. word字号选项设置为中文字号
  18. 抽象函数(Java)
  19. python获取文件换行符_python – 读取文件没有换行符
  20. 1 求长方形的面积和周长

热门文章

  1. WebResponse 跨域访问
  2. 经典水晶报表设计三则
  3. Q103:磨边的物体(Beveled Objects)
  4. 问题六十七:ray tracing学习总结(2016.11.13, 2017.02.05)
  5. 机器学习-决策树(ID3、C4.5、CART)
  6. 企业如何选择数据可视化工具
  7. java命令行参数args_Args4J (Java 命令行参数控制开源项目) 使用指南
  8. python3生成验证码_Python3实现生成验证码图片
  9. Springboot连接不上mysql8_springboot连接mysql8.0问题解决
  10. AcWing 1913. 公平摄影(前缀和+STL)