31Seen and Unseen emotional style transfer for voice conversion with a new emotional speech dataset
文章目录
- 前言
- 一、文章内容
- 二、文章总结
- 三、相关代码
前言
原文地址—2020
一、文章内容
文章想法:
- 整了个新的数据集实现感情风格转换
- 使用了一个变异自编码器这么一个模型进行感情风格变换
- 干净的声音本身划分为三部分,内容、个人的特征、其他的语音语调等,文章就是在保证语言内容和个人特征不变的情况下改变其他的语音语调信息来改变感情的表达状态
- 模型能够实现感情的随意转换,不是特定的1:1转换
- 实现了声音特征的分离和合并,为语音的识别,说话人识别,感情识别,语音合成提高了一种方案
输入数据
文章模型:
训练方式
模型输出
实验结果
文章结论
二、文章总结
- 文章novel和优势:
- 进行语音成分分解学习其中的感情特征等信息
- 利用对抗生成自动学习有用的感情信息
- 同其他文章比较的劣势:
- 感情识别的时候单独使用了一个模块进行感情分类,进行了预训练,这个模块本身精确度不是很高影响结果
- 提取纯语音内容特征的和感情无关特征的时候会方法不是很纯会影响效果
三、相关代码
31Seen and Unseen emotional style transfer for voice conversion with a new emotional speech dataset相关推荐
- Seen and Unseen emotional style transfer for voice conversion with a new emotional speech dataset
会议:icassp 2021 作者:Kun Zhou,lihaizhou 文章目录 abstract 1. introduction 2. Analysis of Deep Emotional Fea ...
- 【论文学习笔记】《An Overview of Voice Conversion and Its Challenges》
<An Overview of Voice Conversion and Its Challenges: From Statistical Modeling to Deep Learning&g ...
- AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss 论文理解
0. Abstract 非并行的多对多语音转换以及零语音转换仍然是未开发的领域.诸如对抗性网络(GAN)和条件变量自动编码器(CVAE)之类的深度样式转换算法已被用作该领域的新解决方案.但是,GAN训 ...
- AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss代码调试过程
论文: AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss 代码实现参考:https://github.com/peis ...
- AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss笔记
文章目录 网络结构 说话人编码器 内容编码器 解码器 声码器 实验 论文: AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder L ...
- 论文阅读 - AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss
文章目录 1 概述 2 模型架构 3 模块解析 3.1 获取梅尔频谱 3.2 speaker encoder 3.3 AutoVC 3.4 Vocoder 4 关键部分 参考资料 1 概述 voice ...
- 吴恩达老师深度学习视频课笔记:神经风格迁移(neural style transfer)
什么是神经风格迁移(neural style transfer):如下图,Content为原始拍摄的图像,Style为一种风格图像.如果用Style来重新创造Content照片,神经风 ...
- 深度摄影风格转换--Deep Photo Style Transfer
Deep Photo Style Transfer https://arxiv.org/abs/1703.07511 Code: https://github.com/luanfujun/deep-p ...
- 谈谈图像的style transfer(二)
总说 主要从几个方面来进行说明吧 - 加快transfer的速度 - 让transfer的效果看起来更加visual-pleasing - 其他的一些方面 - 用GAN来做 加快style s ...
最新文章
- 腾讯姚星:两大科技矩阵助力两张网,立志攻克通用人工智能和多模态问题
- 【并查集】并查集的基本操作总结
- 央行降准,房价可能又要骚动了!
- @Autowired 与 @Resource的区别
- window.location.href重定向 不会触发webview
- strcpy sprintf memcpy 它们之间的区别
- window自动生成数据库连接字符串
- 基于离线策略的强化学习(PPO)
- dosbox中out of memory_flink教程-详解flink 1.11 中的JDBC Catalog
- java微信录音arm转mp3_使用FFmpeg将微信录音 amr格式 转 MP3格式
- 只能上QQ,不能打开网页的解决办法
- 为什么滴滴裁员2000人,被裁员工却像中奖一样开心?...
- 最近很火的ChatGPT和GPT4
- matplotlib总结
- 实现齿轮转动动画CSS3特效
- 项目经理杂事多,该怎么有效的安排时间
- 理解MySQL复制(Replication)
- ImageJ macro 批量vsi转tif
- 【P45】JLH 纯甲类耳放单电源版本
- LOL云顶 开心果、阿米、夜猫 通用版新手使用教程