语音合成技术已进入到人们的日常生活,有声阅读、智能客服、智能家居等场景都已经出现了“它”的身影。有情感的声音,赋予机器生命感,让人机交互更美好、简单。

5月28日,标贝科技重磅推出情感合成方案,主打高音质及高自然度的情感语音合成效果,满足有声阅读、儿童教育、车载、泛娱乐等多场景使用。据悉,标贝科技本次打造情感合成方案,是继3月成功推出留声机方案之后,推出的又一全新TTS解决方案,通过整体提高情感合成声音效果,提升用户的交互体验。

AI情感合成让语音交互更有温度

声音的可用性,可以通过自然度、可懂度、识别度等维度来考量。语音技术的进步,让机器合成的声音不再顿挫、冰冷,在自然度和可懂度等方面取得了不错的成绩,但当前合成效果在合成音的表现力上,特别是语气和情感方面,还有不足。缺乏情感的声音,何谈传递情感,留住用户?

情感合成,可以具有更进一步的声音表现力,传递出文本文字之外更多的信息,做到声情并茂,以更动听的声音,更富有情感地表达内容。

事实上,不同场景及文本类型,对声音的要求也不同,除了基本的高音质、自然度要求外,让声音拥有情感是不可或缺的。同样的文本内容,用不同情感表达出的传递出的意思也不尽相同,需要“音”景制宜,以增强用户的融入感、代入感。例如,这句话“为什么你要这么问我?”试想下用生气、高兴、恐惧等情感说出效果与表达的意思。

此外,随着语音技术推广应用深入不同的服务场景,用户对声音提出了更高的要求。智能客服场景,需要亲和温暖的声音来提高用户的满意度;有声阅读场景,需要根据不同题材搭配出不同声音,让用户感受有声文本的魅力;智慧生活场景的语音交互,需要有情感的声音赋予机器生命力,更懂用户,感受科技生活的美好。

因此,如何进一步提高语音合成的表现力,特别是让合成语音能够模拟表达说话人的情感状态,是语音合成未来发展的趋势,而这也正是标贝科技一直努力的方向。

打造高音质、高自然度、强表现力的情感合成TTS

据标贝科技语音相关负责人介绍,基于深度学习技术及自有定制情感数据,标贝本次推出情感合成TTS,主打高音质、高自然度与多情感,可以呈现出高兴、愤怒、恐惧、哀叹、悲伤等多种情感声音,在韵律表现、声音层次感、情感表达等方面做到更加接近真人情感化表达的语音效果。标贝科技希望通过语音技术的不断创新,打造出更有表现力、更自然、更动听的情感合成语音,持续提升用户交互体验。

例如有声阅读、儿童教育、智能硬件等场景,高音质、自然度的情感很重要。标贝通过使用情感TTS技术,力求在语气、语音、语调、情感等方面接近真人说话,与场景匹配,让用户在不同场景和碎片化时间,进行有声听读获取资讯、体验在线学习教育获得优质体验。

以多角色情感合成为例,由于故事、小说等文本素材包含大量角色人物,通过不同情感合成声音配合文本内容,以展现文学小说人物的的特点,让AI技术生产的有声读物更有“人情味”。

下面通过一个多角色多情感的儿童故事合成样本,来展示标贝情感TTS带来不一样的有声故事体验。

在故事中,我们可以切实感受到故事中人物情感的变化情况,更能够吸引少儿听众,营造一种引人入胜的沉浸感。

来自易观发布《2020年中国音频产业生态发展分析报告》表示,有声市场呈现增长的态势,越来越多的用户开始接受有声阅读这样的形式来收听内容。其中,2020年1季度,在某知名有声书平台的播放量和收听人数上都有显着增长,两者环比分别增长80.32%和39.82%。此外,用户在有声读物的付费购买上也更加积极,2019年该平台整体有声书专辑订单中过半为付费订单。

毫无疑问,有声市场的爆发增长,将诞生大量不同类型的有声内容,相信情感语音合成能够带来更加自然和丰富的语音体验,为有声读物市场提供更有竞争力的差异化产品。

自有数据库加持让情感合成实现“可定制”

事实上,打造自然、高表现力的声音效果,自然离不开语音情感数据支持。数据库是语音合成技术的基础,也是决定语音合成效果的关键因素之一。据了解,标贝科技本次打造的情感TTS,采用了自有定制的高保真的情感语音库。

目前,标贝科技自有定制型语音库已开发出包括中文女声情感音库、多语种多音色男女声音库、粤语语音库、儿童语音库、葡萄牙语音库、台湾普通话语音库、日语音库、韩语音库、明星语音库等数十种类别,IP语音库还在不断丰富和积累中。

基于领先语音技术+高质量的数据库基础,标贝能够提供业内优质的情感解决方案,呈现出声音的多样性、和个性化的合成效果体验。这也是因为标贝科技自成立起,将语音交互效果和数据质量放在首位,拥有完整的采标一体化解决方案,能够实现快速产出高质量的语音合成、语音识别、自然语言处理、计算机视觉等采标服务,为行业提供一站式语音和数据服务。

未来,随着语音技术不断发展,技术与场景的关系变得紧密,而用户需求变得更加个性化。标贝科技将加大技术创新投入,打造更有温度的情感声音,让语音交互效果更“声入人心”。

tts代表_标贝科技推出情感合成TTS 多情感、强表现力声效让交互更有温度相关推荐

  1. 标贝科技推出「留声机」TTS方案,高还原、个性化声效提升交互意愿

    3 月 5 日,标贝科技推出全新 「留声机」,该方案具有高原度复刻效果,用户只需 5 分钟左右即可完成录制,训练过程全自动化处理,大约 2 小时后,即可拥有媲美原声声音的个性化模型,轻松实现文本转语音 ...

  2. 无障碍人机交互时代已向我们走来,标贝科技推出语音合成评测系统

    在AI语音交互全流程中,面对语音识别.语义分析.语音合成这三座大山,我们仍然需要不忘初心,砥砺前行,以期获得更为自然.富有情感的人机交互体验. 标贝科技是一家专注于人工智能数据服务的公司,一直以来秉承 ...

  3. 标贝科技推出情感合成 TTS,让语音交互更有温度!

    语音合成技术已进入到人们的日常生活,有声阅读.智能客服.智能家居等场景都已经出现了"它"的身影.有情感的声音,赋予机器生命感,让人机交互更美好.简单. 5月28日,标贝科技重磅推出 ...

  4. python语音合成 标贝_让机器的声音听起来更像人声,专注语音合成前端技术的「标贝科技」完成千万级人民币融资...

    语音是人工智能和人类的一种主要交互方式:所以AI不仅要有足够聪明的大脑,也需要有足够的表达能力.语音交互包含三个方面:听得清(语音识别).听得懂(语义分析)和说得好(语音合成).这些年在科大讯飞的带领 ...

  5. Gowild狗尾草推出HE琥珀,标贝科技为其提供更“温柔”的声音

    ​​8月22日,"2018Gowild狗尾草品牌发布会"在中国电影导演中心举行.会上Gowild狗尾草公布了"AI虚拟生命"大战略,并发布了基于大战略之下的新一 ...

  6. 标贝科技声音克隆技术赋能 定制语音功能让陪伴触手可及

    "常回家看看,回家看看,哪怕帮妈妈刷刷筷子洗洗碗......"这首脍炙人口的老歌道出了多少父母的期盼,又是多少儿女的遗憾.因为生活,因为工作,我们总是很忙,忙得没有时间回家,甚至打 ...

  7. 首发 | 用声音改变生活,标贝科技完成 A 轮 5000 万人民币融资

    AI科技大本营获悉,日前,专注于智能语音交互技术及数据的"标贝科技"完成 A 轮 5000 万元人民币融资,本轮投资由深创投领投,恒生电子跟投. 值得注意的是,本轮的领投方深创投在 ...

  8. 标贝科技语音论文入选全球顶级语音学术大会INTERSPEECH2019

    全球知名语音学术大会INTERSPEECH2019于9月15日至19日在奥地利格拉茨城市举行. 作为全球智能语音及AI数据发展的推动者,标贝科技受邀成为大会黄金级赞助厂商亮相现场.其中,由标贝语音团队 ...

  9. 欧盟吸纳52名专家入AI咨询委员会 将起草AI伦理指南 |标贝科技

    新浪科技讯 北京时间6月15日上午消息,欧盟今天将52名专家联席命名为"人工智能高级小组"(AI HLG,High Level Group on Artificial Intell ...

最新文章

  1. windows程序设计 c语言,【教程】基于C语言的Windows编程入门
  2. 目前可能最快的下载百度网盘文件的方法(aria2下载)
  3. with grant option mysql_mysql用户及权限(WITH GRANT OPTION)
  4. 回顾 - 判断质数精简算法
  5. 关于Kafka高性能的几个问题
  6. Java实现数组转字符串及字符串转数组的方法
  7. 深入研究java.lang.Runtime类,Process类
  8. MySQL索引优化案例学习总结
  9. 设置SQL Server 2008 以允许远程连接
  10. c语言银行卡六位密码编译,6位随机密码生成器
  11. 好书推荐:创业必看好书排行榜推荐
  12. json嵌套字典数据获取
  13. 集成模型Bagging和Boosting的区别
  14. 斐波那契数列——《剑指offer》
  15. Python抓取网页云音乐指定歌手的歌曲和评论数量
  16. Greenplum 优化 - 分布式键,重建索引,序列
  17. 苹果CMS搭建影视网站教程
  18. 图像处理入门和UltraLAB P620系列全能型、高性能、静音级便携工作站
  19. 秉火429笔记之十五 DMA--直接存储区访问
  20. 币须知道 |首批19家企业入驻杭州区块链产业园,纳斯达克:股市中仅5%的 IT供应商部署区块链...

热门文章

  1. 通信端口感叹号_解决通用串行总线控制器总是有感叹号的办法
  2. HTML 使用table标签制作个人简历
  3. 改善程序员脑力的70条方法
  4. 杰理之充电芯片选型【篇】
  5. Spring IoC和DI XML方式 注解方式 依赖注入 AOP面向切面
  6. 3D游戏编程与设计——游戏的本质章节作业与练习
  7. jmeter常用逻辑控制器的使用(如果(if)控制器)
  8. pytorch动态网络以及权重共享
  9. pandas数据分析和pyecharts可视化周杰伦MV弹幕(多图长文)
  10. 无线通信模块——WiFi,蓝牙,2.4G