在语音交互领域,语音合成是重要的一环,其技术也在不断发展。近年来,人们对情感合成的兴趣和需求越来越高。情感语音合成会让机器如真人一样和我们交流,它可以用愤怒的声音、开心的声音、悲伤的声音等不同情绪来表达,甚至是不同强度的不同情绪。

而情感语音转换技术可以在保持说话人身份和语言内容不变的前提下,将语音从一种情感状态转换为另一种情感状态。简单说就是在保持良好的目标说话人音色的同时,将情感表达从一个情感说话人适当地迁移到目标说话人。

图片
情感语音合成技术

图片
情感语音合成系统可以使用说话人及情感嵌入的模型方案。用情感做标签,即在原有网络基础上增加一个情感标签,这些情感的信息会通过网络得到学习。

说话人嵌入是通过神经网络来得到一个说话人向量,需要一定规模的多人数据库进行训练。

情感嵌入则需要情感数据结合说话人向量来实现情感语音合成的模型,所以需要高质量、多情感的数据。

情感语音转换技术

如跨说话人情感迁移可以利用情感和音色扰动,分别学习说话人和情感相关的语谱,为最终的语音生成提供显式的情感特征。说话人相关即保持目标说话人的音色,情感相关即捕捉源说话人的情感表达,因此需要多人多情感和多人无情感的数据来共同训练。

情感语音应用场景

虚拟形象:可以让虚拟的人物具有一定的情感表现能力。
短视频配音:可以为短视频的内容进行配音,使内容更加生动有趣。
游戏角色:可以让用户在游戏中有更好的体验。
影视动画:可以进行生动的解说。
智能客服:可以提高人机交互体验,让互动充满乐趣。

数据堂情感语音数据库推荐

01

单人情感语音数据库

由单个发音人,在专业录音棚内进行录制。

13.3小时中文女声情感合成库

01

由温柔亲切的年轻女性录制,分别为高兴、愤怒、悲伤、惊讶、恐惧和厌恶六种情感文本。语料音素覆盖均衡,专业语音学家参与标注,文字标注的字准确率不低于99.9%,音素标注的句准确率不低于99%,韵律标注的句准确率不低于98%。
02

多人情感语音数据库

由多个发音人,在专业录音棚内进行录制。

22人中文情感合成库

01

发音人男女比例均衡,覆盖了儿童、青年、老年不同年龄段。每人采集高兴、愤怒、悲伤、惊讶、恐惧和厌恶六种情感,每种情感20分钟。文本风格自然口语化,语料音素覆盖均衡,专业语音学家参与标注,文字标注的字准确率不低于99.9%,音素标注的句准确率不低于99%,韵律标注的句准确率不低于98%。
本数据库中的22人选自数据堂成品数据库“100人中文通用平均音色合成库”。两套数据库叠加使用可实现情感语音合成及跨说话人情感迁移等技术。

20人中文情感合成库

02

发音人男女比例均衡,覆盖少年、青年、中年、老年等不同年龄段,每人采集高兴、愤怒、悲伤、惊讶、恐惧、厌恶和中性7种情感,每种情感20分钟。文本均为小说风格,语料音素覆盖均衡,专业语音学家参与标注,文字标注的字准确率不低于99.9%,音素标注的句准确率不低于99%,韵律标注的句准确率不低于98%。
03

多发音人平均模型库

由多个发音人,在专业录音棚内进行录制。

100人中文通用平均音色合成库

01

涵盖新闻、日常口语、有声读物、诗词、广告、消息播送、娱乐等类别,语种涵盖中文、英文、中英混读,发音人男女各50人,涵盖儿童、成人、老人的不同年龄段,每人录制600到700个句子。并标注了文字、音素、4级韵律、音素边界。
作为全球领先的人工智能的数据服务商,数据堂可以为客户提供丰富的情感语音数据,通过这些数据训练的人工智能,合成在情感和表达上更加丰富的语音,让合成的声音更加自然真实,更好的应用在不同的场景。

数据推介⎮情感语音合成音库相关推荐

  1. 情感语音合成技术难点突破与未来展望

    Photo by Lukas from Pexels 语音技术的进步,让机器合成的声音不再顿挫.冰冷,在自然度和可懂度等方面取得了不错的成绩,但当前合成效果在合成音的表现力上,特别是语气和情感方面,还 ...

  2. Python语音合成-第三方库(gTTs/pyttsx3/speech)横评(内附使用代码)

    Python文字转语音(调研&成品函数) 由于项目需要, 我需要将文字转换为语音, 那么第一步就要进行调研 什么是语音合成技术? 语音合成(text to speech),简称TTS.是将文字 ...

  3. 基于机器学习的人民日报和微博等与疫情有关话题数据两极情感分析

    全套资料下载地址:https://download.csdn.net/download/sheziqiong/85584594?spm=1001.2014.3001.5503 目录 1.中文分词 Ch ...

  4. 用Python做数据商品情感分析(商品评论数据情感分析)

    用Python做数据商品情感分析(商品评论数据情感分析) 现在,我们得到了一些关于XX商品的评论信息的数据,我们需要对这些评论信息的数据进行情感分析: 分析步骤 机械压缩去词 短句过滤 情感分析 分词 ...

  5. 大连理工大学中文情感词汇本体库(含情绪分析代码)

    中文文本数据的情绪计算 昨天 如何对微博推文进行情绪分析(细粒度情感分析) 介绍了英文的NRC情绪词典.虽然支持中文,但由于制作问题,导致并不完全适应中文场景.今天介绍大连理工大学中文情感词汇本体库 ...

  6. 必备 | 人工智能和数据科学的七大 Python 库

    来源:新智元 本文约3100字,建议阅读10+分钟. 本文汇总了2018年针对数据科学家/AI的最佳库.repos.包和工具. [ 导读 ]作者根据每周发布总结的系列文章,汇总了2018年针对数据科学 ...

  7. python tushare获取股票数据并可视化_荐Python获取股票数据及其可视化--基于tushare库...

    01 Tushare简介 Tushare是一个金融大数据开放社区,它免费提供各类金融数据和区块链数据 , 助力智能投资与创新型投资.在Tushare 旧版 运行了3年后,Tushare Pro终于要跟 ...

  8. garch预测 python_数据科学方面的Python库,实用!

    作者:Python开发与大数据人工智能原文:公众号 Python开发与大数据人工智能 Python是一种很棒的编程语言.事实上,它还是世界上发展最快的编程语言之一.它一次又一次证明了它在数据科学职位中 ...

  9. javascript 图表_我如何使用JavaScript数据透视表和图表库分析开发人员趋势

    javascript 图表 Hi, dev community! 嗨,开发者社区! Today I'd like to share my experience of analyzing develop ...

最新文章

  1. JS动态改变文本中光标位置
  2. 「高并发秒杀」linux安装软件有哪几种方式
  3. weblogic查看内存情况
  4. Python爬虫CSS Selector的使用
  5. 突发!Spring 也沦陷了。。。
  6. 关闭mysql密码策略_MYSQL57密码策略修改
  7. 2018-2019-2 网络对抗技术 20165318 Exp 9 Web安全基础
  8. 设计素材PSD分层模板|美食类海报设计技法
  9. 第三方网站调用微信公众号的图片被禁止
  10. 部署Java Web项目到Heroku
  11. 1051. Pop Sequence (25)
  12. flacs 安装教程_绍兴拖拽式撬装加油装置建站方案
  13. js上传图片到服务器
  14. 微软文本转语音小工具(Text to speech)
  15. 如何修改计算机网络密码,无线网密码怎么改,教您如何修改无线网络密码
  16. codeforces 1436E Complicated Computations
  17. 在线微信编辑器(构思编辑器)——如何让微信公众号文章图文设计更完美
  18. python新闻文本爬虫_python学习_新闻联播文字版爬虫(V 1.0版)
  19. 流媒体选择Nginx是福还是祸?
  20. as3读写本地xml/txt

热门文章

  1. 网页中的相对路径和绝对路径
  2. list集合删除最后一个元素
  3. 工作空间、功能包、节点
  4. GeoJSON全网最详细的介绍与解读
  5. linux+arm+gpu加速,加速可执行程序Linux - arm处理器。比特切换
  6. Android ANR问题总结(非原创)
  7. 谷歌广告账号为什么会被封?如何解决谷歌账号封号问题?
  8. Tarjan相关最全(附训练题和答案)
  9. 助力疫情防控,重塑企业流程,人工智能成为复工之路的有力保障
  10. python中sum函数的使用方法及实例_python 运行sum函数的使用