本文首发在——easyAI——人工智能知识库

小白版本

语音合成就是让机器模仿人类说话。即输入一段文字,最终输出一段语音。

做个比较,当机器的“脑子”里想到了一段内容时,或者是看到了一段话时,知道哪些字应该怎么读:

  1. 拆解文字,得到音素的时长、频率变化,就和我们有时拆解文字的偏旁、前后缀来获得文字发音一样
  2. 知道哪些字的组合会是一个词,将这段内容按照人类容易理解的方式说出来知道哪些字的组合会是一个词,将这段内容按照人类容易理解的方式说出来
  3. 在说出来的过程中还会结合这个人的说话习惯、发音特色、口音特点等,得到一段人类特性明显的语音。(Google 已经做出了很想人类的机器声音,查看视频演示)

和人类学说话一样,机器也需要通过大量的语音片段作为“听力材料”,才能学会发音技巧。以及还得学会一些语言规则,比如语法和韵律,才能像人类一样,说话语气、语境,能表达出字面之外的表意。不然,机器只会说出生硬、没有情感、不连贯的话(就像一些动漫或游戏作品中机器人角色的对话)。

音合成技术目前主要应用在读书软件、导航软件、对话问答系统等中。

百度百科版本

语音合成是通过机械的、电子的方法产生人造语音的技术。TTS技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。

查看详情

维基百科版本

语音合成是人类语音的人工生成。用于此目的的计算机系统称为语音计算机或语音合成器,并且可以用软件或硬件产品实现。甲文本到语音(TTS)系统转换正常语言文本转换成语音; 其他系统呈现符号语言表征,如将语音转录为发音。

查看详情

扩展阅读

语音合成 TTS | AI 产品经理需要了解的 AI 技术概念

语音合成 TTS (Text-To-Speech) 的原理是什么?

方兴未艾的语音合成技术与应用

探秘语音合成技术的前世今生

人工智能的嘴巴——语音合成(Text to Speech | TTS)相关推荐

  1. 语音合成(TTS)论文优选:过平滑问题分析及优化Revisiting Over-Smoothness in Text to Speech

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  2. 微软职位内部推荐-Senior Speech TTS

    微软近期Open的职位: Senior Software Development Engineer Lead / Senior SDE (Microsoft China – SuZhou/Beijin ...

  3. Windows phone 应用开发[1]-Text To Speech

    最近几个月一直在专注Windows phone产品设计和项目开发.在其中团队磨合和产品定位上也出现不少问题.一直难以抽出成块的时间来思考梳理.至此博客更新也从此中断.这两天因病在家休息.上周在微博[F ...

  4. 吾剑未尝不利,国内Azure平替,科大讯飞人工智能免费AI语音合成(TTS)服务Python3.10接入

    微软Azure平台的语音合成(TTS)技术确实神乎其技,这一点在之前的一篇:含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入),已经做过详细介绍, ...

  5. 语音合成android代码,百度 TTS 语音合成-Android

    参考百度语音合成demo,MiniActivity.java 抽离代码. 初始化 mSpeechSynthesizer放在Application 中,并在Activity调用,但是无法正常播放.先贴出 ...

  6. 语音合成模块 文本转TTS 真人发音 SYN6288

    简 介: 测试了一款基于UYN6288的TTS模块.在开始使用ESP32-S对SYN6288进行控制的时候,出现了一些问题.具体原因还需要另外进行测试. 关键词: SYN6288,TTS,ESP32- ...

  7. java调用微软语音库,程序员罗杰-.NET C# 语音合成源码(TTS)微软库

    应表哥要求,写一个简单的TTS软件,他们单位上用于广播通知用.源码如下: 简单说明: public partial class frmMain : Form { public frmMain() { ...

  8. Revisiting Over-Smoothness in Text to Speech

    ACL2022 Ren yi 文章目录 abstract 多峰问题证明 数据简化 模型建模 附录 Fastspeech2+Gan abstract 非自回归TTS的生成结果有over-smooth的问 ...

  9. 微软文本转语音小工具(Text to speech)网页版

    之前在52破解上看到有人发布了一个文本转语音的小软件,使用微软提供的免费的文本转语音接口,自己闲着没事做了一个网页版的,用php调用微软接口生成语音.感兴趣的同学可以看下. 地址:www.text-t ...

最新文章

  1. python中sys.stdout、sys.stdin
  2. poj3268(最短路)
  3. phpstorm一个窗口打开多个项目
  4. Git cherry-pick后再merge出现一个“奇怪”的现象
  5. 1024程序员节:心疼被段子手黑得最惨的你们
  6. nginx服务器防sql注入/溢出***/spam及禁User-agents
  7. rocketmq python消息堆积_编写shell脚本监控rocketMQ消息堆积并推送钉钉
  8. LINUX环境变量environ
  9. 异常检测 and GAN网络(2)
  10. 解决isilon网络配置界面无配置显示
  11. 百度推广怎么调整计算机优先,百度竞价优化关于帐户层级的一些设置方法与技巧...
  12. 心脑血管应该注意那些?
  13. 服务器虚拟机的c盘怎么加,xp虚拟机c盘怎么扩容
  14. pdb文件及其作用(转)
  15. 如何运用dos命令进入指定目录
  16. air报错 Context3D not available. fd as3项目默认不开启gpu加速的问题
  17. 雪碧图HTML人物,animateSprite-可控制雪碧图(sprites)动画的jQuery插件
  18. 出现/usr/lib64/erlang/erts-10.3/bin/beam.smp: error while loading shared libraries: libtinfo.so.5解决方法
  19. 歌词抓取,python,练习
  20. RFID固定资产管理

热门文章

  1. ffmpeg 合并拼接 mp4视频
  2. 硬件使用74hc138的C语言程序,单片机74HC138三八译码器的原理及应用方法
  3. hive获取近12个月数据
  4. 查询最近12个月的数据SQL语句
  5. java基于微信小程序的投票系统 uniapp 小程序
  6. rtems总体设计思路
  7. 腾讯和蘑菇街的面试总结
  8. 网页版2048html制作,基于HTML+CSS+JS的网页版2048的实现.pdf
  9. 解决word中插入visio对象的图片大小修改问题
  10. 点击左右箭头实现内容滑动