目前,语音合成领域的风格情感控制是一个比较热门的话题,它将决定着语音合成中的似人度和灵活性以及可转换性。5月4日晚 20:00LiveVideoStack线上分享第五季,第八期,我们邀请到了喜马拉雅 音频算法工程师 贺雯迪分享语音合成的基本模块以及风格迁移的概念,详解基于Multihead-Attention的Global style token算法原理以及现在目前比较值得探索的变分自编码器在语音合成中对说话人风格控制的应用。

嘉宾简介

贺雯迪 喜马拉雅 音频算法工程师

爱丁堡大学人工智能硕士,喜马拉雅音频算法工程师。研发经历:TTS前端模块(文本正则、分词算法、韵律预测等),后端算法(基于深度生成模型VAE的说话人风格控制、音色转换、音色克隆、few-shot learning、神经声码器的优化等)。

关于LiveVideoStack线上交流分享

为了给大家提供一个学习,交流的平台,畅聊音视频技术开发新趋势,新实践。我们推出了LiveVideoStack线上交流分享活动,邀请业内资深技术专家进行线上分享技术干货,解答热点问题。你可以通过以下方式参与:

  • 扫描图中二维码关注LiveVideoStack公众号【livevideostack

  • 回复“分享”,即可获得进入直播群的方式

LiveVideoStack线上分享第五季(九):语音合成中的风格控制相关推荐

  1. LiveVideoStack线上分享第五季(十三):高性能视频硬件编码

    面向4G/5G场景下视频业务的爆发以及用户对于更高画质的要求(直播.短视频.视频点播等业务),更高清的画质意味着需要更大的计算资源以及网络带宽资源,而海量用户侧的画质提升/宽带降低,会导致前端以及视频 ...

  2. LiveVideoStack线上分享第五季(十二):移动端多种通话场景统一技术方案实践...

    移动端通话,有很多种玩法,比如直播.两个主播视频聊天,多个用户语音聊天.今晚 19:30,LiveVideoStack线上分享第五季,第十二期,我们邀请到了 前战旗直播 高级流媒体工程师 石硕详细介绍 ...

  3. LiveVideoStack线上分享第五季(十一):Open WebRTC Toolkit实时视频分析系统

    5月17日19:30,LiveVideoStack线上分享第五季,第十一期,我们邀请到了Intel 高级软件工程师 吴秋娇 详细介绍OWT视频分析解决方案,视频分析架构,如何构建基于GStreamer ...

  4. LiveVideoStack线上分享第五季(八):播放器的极致体验优化

    视频播放的用户体验主要体现在反应速度上快速,视觉上的连续,包括秒开与切换等等.4月12日晚 19:30,LiveVideoStack线上分享第五季,第八期,我们邀请到了网易云音乐 高级技术专家 林勇平 ...

  5. LiveVideoStack线上分享第五季(七):开源流媒体服务器:为何一定得再撸个新的...

    视频技术的主要场景是直播和RTC,2020年IoT和5G的快速发展,以及全球居家隔离,促进了视频行业的大规模发展,也促进了直播和RTC的融合,将带来更加丰富的业务场景.开源社区也在不断进步,而直播.R ...

  6. LiveVideoStack线上分享第五季(五):用FFmpeg搭建基于CNN的视频分析方案

    基于卷积神经网络(CNN)的视频分析在日常生活中应用地越来越广泛,也对软件开发人员提出了更多的挑战.FFmpeg作为一个集录制.转换.音/视频编码解码功能为一体的开源框架,自然也需要考虑怎样去和当下流 ...

  7. LiveVideoStack线上分享第五季(四):基于Nginx的媒体服务器技术

    国内应用比较多的开源流媒体服务器有SRS和nginx-rtmp-module,其中nginx-rtmp-module一直以来由于功能少.集群化难度大所诟病.3月8日 19:30,LiveVideoSt ...

  8. LiveVideoStack线上分享第五季(三):新一代直播传输协议SRT

    SRT(Secure Reliable Transport)是基于UDT的传输协议,保留了UDT的核心思想和机制,针对音视频进行了多项改进.SRS 4.0中合入SRT,并且开发提供基于SRT自适应 b ...

  9. LiveVideoStack线上分享第五季(一):企业视频会议场景下的流量分发和弱网优化...

    严峻的疫情之下,远程办公成为了企业实现高效复工的必然选择,众多视频会议平台在特殊环境下也开始提供短期免费开放及功能升级服务.疫情将远程办公推上了风口的同时,也为这些平台的运作带来了更多的挑战.今晚 1 ...

最新文章

  1. Linux虚拟内存和物理内存精华【美】
  2. 限免!百名AI大咖,20大技术和行业论坛,不可错过的开发者嘉年华
  3. 吐槽express 中间件multer
  4. android编译会生成class吗,请教下Android N混合编译生成的base.art中的类在运行时最终添加到哪个classloader的问题...
  5. opensuse 12.1 启动脚本
  6. 2021年网购大数据:哪些品类坑最多?什么价位的商品最有保障?
  7. python双循环zip_Python 并行遍历zip()函数使用方法
  8. STC89C52RC单片机例程实现_流水灯0(C语言实现)
  9. html5 audio 获取播放时间,html5 audio 延时获取播放路径播放失败
  10. 【转】TFS自动签出解决方案sln或者项目文件csproj的解决办法
  11. Network Emulation(网格模拟)
  12. 源码大招:不服来战!撸这些完整项目,你不牛逼都难! 1
  13. Android必知必会-使用Intent打开第三方应用及验证可用性
  14. python去重脚本
  15. c++随笔——隐藏窗口
  16. 用Origin将Fluent中的数据导出并绘制云图
  17. 个人小程序和企业小程序
  18. 【华为联机对战服务】如何保存及查看联机对战SDK日志?
  19. 社交+小游戏方案来袭,全方位提升社交APP的活跃留存
  20. 婚宴座位图html5,婚宴酒席座位安排图 20桌婚宴座位安排图

热门文章

  1. GridView里面嵌套RadioButton
  2. 【测试基础】测试用例的设计方法
  3. linux中shell变量$#,$@,$0,$1,$2的含义解释:
  4. JavaScript进行UTF-8编码与解码
  5. onMeasure onLayout用法,区别
  6. 教你如何将UIImageView视图中的图片变成圆角
  7. HDU多校7 - 6853 Jogging(bfs+结论)
  8. HDU多校2 - 6774 String Distance(序列自动机优化lcs)
  9. HDU - 6186 CS Course(维护前缀+后缀)
  10. android 点击item跳转页面,Android RecyclerView Item 点击事件,简单