ASP(Attentive Statistics Pooling for Deep Speaker Embedding)
本文使用注意力机制赋予不同的帧不同的权重,并且同时生成加权平均数、加权标准差。
实现流程
网络结构
Pooling layer将变长的frame-level features转换为一个定长的向量。
Statistics pooling
取frame-level features的平均值与标准差
⊙ 代表Hadamard product
标准差还包含了说话人在长时间语境中的时间变异特征。
Attention mechanism
在一段话中,往往某些帧的帧级特征比其他帧的特征更为独特重要,因此使用attention赋予每帧feature不同的权值。
其中f(.)代表非线性变换。再用softmax将其标准化
最后将每帧特征加劝求和
Attentive statistics pooling
同时考虑了attention与标准差
实验
ASP(Attentive Statistics Pooling for Deep Speaker Embedding)相关推荐
- Serialized Multi-Layer Multi-Head Attention for Neural Speaker Embedding阅读笔记
主要看模型方法 Abstract 提出一个串行多层多头注意力针对neural speaker embedding,之前是将一帧的特征聚集起来进行表示.我们提出利用堆叠式的self-attention机 ...
- Paper8:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 还未读
- Detail-Preserving Pooling in Deep Networks
论文阅读:Detail-Preserving Pooling in Deep Networks 个人分类: paper Title: Detail-Preserving Pooling in Deep ...
- [SPP-NET]Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一.相关理论 本篇博文 ...
- 目标检测--Spatial pyramid pooling in deep convolutional networks for visual recognition(PAMI, 2015)
Spatial pyramid pooling in deep convolutional networks for visual recognition 作者: Kaiming He, Xiangy ...
- 文献学习(part14)--Structural Deep Network Embedding
学习笔记,仅供参考,有错必纠 文章目录 Structural Deep Network Embedding ABSTRACT INTRODUCTION RELATED WORK Deep Neural ...
- Zero-shot Learning零样本学习 论文阅读(五)——DeViSE:A Deep Visual-Semantic Embedding Model
Zero-shot Learning零样本学习 论文阅读(五)--DeViSE:A Deep Visual-Semantic Embedding Model 背景 Skip-gram 算法 算法思路 ...
- 【论文阅读|深读】SDNE:Structural Deep Network Embedding
目录 前言 ABSTRACT 1. INTRODUCTION 2. RELATED WORK 2.1 Deep Neural Network 2.2 Network Embedding 3. STRU ...
- 【PaperReading】DAEGC : Attributed Graph Clustering: A Deep Attentional Embedding Approach
DAEGC : Attributed Graph Clustering: A Deep Attentional Embedding Approach DAEGC: 属性图聚类 : 一种深度注意力嵌入方 ...
最新文章
- Nginx配置文件nginx.conf中文详解(总结)
- 傻子的成长日记,编程路上	2016-04-07
- python获取当前时间的函数_java/python中获取当前系统时间,并与字符串相互转换格式,或者转化成秒数,天数等整数...
- gson 自定义对象转换格式
- [mmu/cache]-Cache Type Register(CTR)寄存器介绍-InProgress
- Netronome为中国云计算大幅提速升效降成本
- 7 centos 修改磁盘uuid_Centos7修改分区空间
- CodeChef - NWAYS 组合数 朱世杰恒等式
- nginx优化-nginx事件处理模型优化use epoll;
- win7内部版本7601副本不是正版
- 如何在 ASP.NET Core 中为同一接口配置不同的实现
- 接口 EnvironmentAware
- SpringBoot约定大于配置的特性解读 SpringBoot快速入门
- java 自定义 operator_见微知著——从自定义类型的operator==说起
- python基础元组(五)
- iphone主屏幕动态壁纸_苹果11怎么设置动态壁纸?这个简单!只需这样操作
- 世界500强面试题(情商部分)
- Linux 网站推荐
- android虚拟pdf打印机,pdf虚拟打印机(PDF-XChange Lite Printer)
- 验证iOS应用的无障碍特性