SH Symposium Series on Speech (SH SSS 2022) ,SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台。 来自AI语音技术领域的优秀论文作者、专家学者,用最精炼的表达来解读最新的高质量论文。

分享的论文成果来自国内外顶级会议收录的优秀文章、前沿学术报告。

主题 Tittle

面向有声读物的跨说话人语音风格迁移

时间 Time

2022年10月11日 19:00 - 19:40

嘉宾 Author

李翔,清华大学深圳国际研究生院硕士生。主要研究方向为表现力语音合成,合作工作发表在Interspeech、ICASSP等语音领域旗舰会议中。

概述 Abstract

本文面向有声读物的自动生成,提出了一种跨说话人的语音朗读风格迁移方法。该方法可以在给定的说话人缺乏目标朗读风格的真实数据情境下,灵活组合不同音色和风格并合成出整体风格一致的有声读物。该方法基于多尺度的参考音频风格模型进行有声读物的语音风格建模:在局部尺度(local-scale)建模有声读物语音的韵律起伏(prosody);在全局尺度(global-scale)建模朗读者的音色(timbre)和有声读物的整体风格类型(genre)。特别地,全局模块的输入为多个相邻句子组成的块(chunk),以提高全局尺度建模的稳定性,并更好地建模读物的整体风格;该全局模块还通过两个平行分支,分别提取音色、整体风格类型的隐层表征,并基于可切换对抗分类器(Switchable adversarial classifier,SAC)进行音色表征与风格类型表征的解耦,以便后续灵活组合不同来源的表征,最终实现跨说话人的朗读风格迁移。

题 目 Tittle:面向有声读物的跨说话人语音风格迁移

期 刊 Journal & Comments:Proc. Interspeech 2022

作 者 Authors:李翔,宋长河,魏宪豪,吴志勇,贾珈,蒙美玲

论文地址 Url:https://www.isca-speech.org/archive/pdfs/interspeech_2022/li22ca_interspeech.pdf

论文代码 Code:Towards Cross-speaker Reading Style Transfer on Audiobook Dataset | Accepted to INTERSPEECH 2022

议程 Program Overview

参与方式 Joining

直播将通过CSDN直播间进行直播

手机端、PC端可同步观看

SH-SSS丨面向有声读物的跨说话人语音风格迁移-CSDN直播

SH-SSS丨面向有声读物的跨说话人语音风格迁移相关推荐

  1. ICASSP2021丨多说话人多风格音色克隆大赛(M2VoC)

    竞赛简介 文语转换(TTS)又称为语音合成,旨在将文本转换成自然语音的一类技术,是智能语音领域的前沿技术,在语音助手.信息播报.有声读物等方面具有重要的应用价值.在深度学习的帮助下,语音合成已实现了效 ...

  2. 想知道有声读物应该怎么做吗

    在当今快节奏的生活中,有声读物成为越来越多人追寻的休闲方式.有声读物是一种将文字转化为声音的媒介,通过配音和音效等手段,让文字焕发出生动的色彩.它不仅满足了人们对知识与娱乐的需求,更为那些繁忙而无法抽 ...

  3. SH-SSS丨跨年龄声纹识别:学习年龄不变的说话人特征

    SH Symposium Series on Speech (SH SSS 2022)  SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台. 来自AI语音技术领域的优秀论文作者. ...

  4. asp租用和saas租用_最佳下载,租用和购买有声读物的网站

    asp租用和saas租用 We recently published a list of websites where you can download free eBooks, or purchas ...

  5. python语音分割_用7行Python代码构建自己的有声读物

    点击关注我哦 欢迎关注 "小白玩转Python",发现更多 "有趣" 有声读物是我们可以通过音频听取一本书或者其他作品的内容,是现下一种很受欢迎的阅读方式.类似 ...

  6. 使用Audacity制作ACX有声读物 ACX Audiobook Production Using Audacity

    如何仅使用Audacity达到ACX有声读物标准 你会学到: 如何安装本课程中使用的四个免费奈奎斯特插件 如何为ACX有声读物录制设置Audacity偏好设置 如何使用打孔和滚动录音修复叙述错误 如何 ...

  7. wps文字 用WPS如何演示制作英语有声读物

    转载请说明来源于"厦门SEO" 本文地址:http://www.96096.cc/Article/169699.html wps文字 孩子学英语,发音是难点,常常前面学后面忘.要是 ...

  8. 免费下载有声读物获取您自己!

    免费下载有声读物获取您自己! 读的书是一个迷人的和有价值的爱好.这感觉很好简单地躺在你的床上,而阅读您喜爱的书籍.然而,现在人们都太忙,以配发时间看书.对于一些人来说,读书是他们的优先级最低的一部分. ...

  9. 基于微信小程序的毕业设计题目(22)php有声读物音频播放小程序(含开题报告、任务书、中期报告、答辩PPT、论文模板)

    项目背景和意义 目的:小程序是一种不需要下载安装即可使用的应用,它实现了应用触手可及的梦想,用户扫一扫或者搜一下即可打开应用.另一方面,面对有声阅读的收费化,广告化的趋势,我希望给用户提供免费.舒适. ...

最新文章

  1. 5see我看视频交友客户端 v2.3.0.11官方版
  2. C++学习笔记5[函数]
  3. php yaf 教程,Yaf教程2:入门使用
  4. linux系统下nginx安装目录和nginx.conf配置文件目录
  5. c#foreach循环_C#| 使用foreach循环打印整数数组
  6. C++ 重载赋值运算符与11选5平台修复
  7. 案例:用户登录(html--servlet--mysql)
  8. 从前M个字母中取N个的无重复排列(回溯)
  9. Web开发之二:什么是前端、什么是后端
  10. 月薪五万挖过来的高管第二天就离职了,为何公司总留不住优秀人才?
  11. Java 异常Exception e中e的getMessage()和toString()以及 e.printStackTrace();方法的区别
  12. docker es持久化_docker如何保持数据持久化?其实可以考虑通过数据卷挂载的方式~...
  13. python身份证号码计算年龄
  14. 对涉密计算机检查内容,保密工作检查内容主要有哪些
  15. 计算机缺少什么无法正常启动,电脑无法正常启动
  16. debian docker_如何在Debian 10上安装和使用Docker
  17. 计算机模拟技术在高分子领域的应用,模拟技术的原理、方法及在高分子材料研究中的应用...
  18. 上帝给我们大龄程序员的出路,就在这!(附:现状分析)
  19. sklearn cheat sheet
  20. 图像数字识别、数字分割(OCR识别,毕业设计)

热门文章

  1. 黑苹果MacOS Monterey 12.0 -12.3 OpenCore 0.8.0 (OC) 引导升级教程(最新版)
  2. 软件测试理论-缺陷管理
  3. matlab fft频率轴,FFT(快速傅里叶变换)中频率和实际频率的关系
  4. Python实现修改图片分辨率(含完整源码)
  5. camstar portal使用webapi,vue elementui前后端分离开发
  6. Arduino IDE安装UNO和NANO开发板驱动教程(CH341SER.EXE)
  7. Android如何用release包抓包
  8. Python短文本自动识别个体是否有自杀倾向【新手必学】
  9. laysns程序用户中心美化模板
  10. java赫夫曼编码(含赫夫曼编码代码)