前言

虽然说目前语音识别,合成这块技术已经很成熟了,没什么可以拓展的地方了,但是还是想自己实现一下在ros下进行语音识别以及熟悉整个流程,感觉还是挺cool的。
目前这块属科大讯飞和百度语音这两公司做的不错,不过还有其他的一些比如:思必驰,捷通华声,云之声,图灵OS等
ros下的语音交互系统,原生态的主要是支持的一个叫cmu sphinx,

支持多种语言,英语和德语都是支持的。
比如苹果手机的siri,它主要是Nuance公司来做的,应该是目前语音这块最前端的公司了,

还有一个叫festival,它是lincx可以简单实现的一个语音交互系统,它是由爱丁堡大学开源的,测试也很简单

还有Ekho(余音)是一个免费、开源的中文语音合成软件。它目前支持粤语、普通话(国语)、广东台山话、诏安客语、藏语、雅言(中国古代通用语)和韩语(试验中),英语则通过eSpeak或Festival间接实现。Ekho支持Linux、Windows和Android平台。

介绍完国外的,下面来介绍国内的,国内的语音识别技术如下:

NLU以前叫NLP,其实是一个东西,叫做自然语言处理(natural language process)

语音唤醒

百度语音唤醒

科大讯飞语音唤醒
语音唤醒(VoiceWakeuper)通过辨别输入的音频中特定的词语(如“讯飞语点”),返回被命中(唤醒)结果,应用通过回调的结果,进行下一步的处理,如点亮屏幕,或与用户进行语音交互等。唤醒资源中含有一个或多个资源,只要命中其中一个,即可唤醒。需下载使用对应的语音唤醒SDK。

语音听写主要API调用流程如下图所示:

思必驰 收费

像如上所述的语音识别方面的公司都提供在线体验功能,感兴趣的可以登录其官网体验一下。效果还是不错的。

语音识别ASR

百度在线语音识别

科大讯飞在线语音识别ASR

云之声在线识别ASR

语义理解

图灵机器人 免费在线使用5000次每天

云之声 在线体验

科大讯飞 免费在线使用体验

捷通华声(灵云在线体验)

语音合成TTS

科大讯飞语音合成TTS

云之声

百度在线语音

捷通华声

接下来的教程会逐渐把这些语音交互流程与ros结合起来,并且在ros上实现。比如语音合成啊,语音识别啊,语义理解啊,让机器人也具备语音交互功能。

ROS实战(一) 语音交互系统的学习:初步了解语音交互流程相关推荐

  1. 软件测试 | 测试开发 | 智能音箱语音交互系统简介与测试初探

    随着AI技术的发展,智能语音交互技术也得到了巨大的发展和应用.由于语音是最自然的交互形态之一,有着输入效率高.门槛低.方便解放双手以及能有效进行情感交流的优势,使得智能音箱成为语音交互的典型应用产品. ...

  2. 智能音箱语音交互系统简介与测试初探

    随着AI技术的发展,智能语音交互技术也得到了巨大的发展和应用.由于语音是最自然的交互形态之一,有着输入效率高.门槛低.方便解放双手以及能有效进行情感交流的优势,使得智能音箱成为语音交互的典型应用产品. ...

  3. 自动驾驶系统进阶与项目实战(三)基于全卷积神经网络的点云三维目标检测和ROS实战

    自动驾驶系统进阶与项目实战(三)基于全卷积神经网络的点云三维目标检测和ROS实战 前面入门系列的文章中我介绍了几种点云三维分割/目标检测模型,在做点云预处理上,有通过球面投射(SqueezeNet)得 ...

  4. 机器人操作系统(ROS)在线实训平台学习实验指南

    2019年更新:ROS 1.0(Kinetic)和ROS 2.0(Ardent)安装与测试 试用和学习机器人操作系统最便捷的打开方式 https://blog.csdn.net/ZhangRelay/ ...

  5. 爱奇艺HomeAI智能语音交互系统的技术实践

    「免费学习 60+ 节公开课:投票页面,点击讲师头像」 作者 | 爱奇艺研究员 ShaneWang 出品 | AI科技大本营(ID:rgznai100) 本期爱奇艺技术沙龙<语音和语言技术在自然 ...

  6. Keras深度学习实战(4)——深度学习中常用激活函数和损失函数详解

    Keras深度学习实战(4)--深度学习中常用激活函数和损失函数详解 常用激活函数 Sigmoid 激活函数 Tanh 激活函数 ReLU 激活函数 线性激活函数 Softmax 激活函数 损失函数 ...

  7. OpenCV-Python实战(18)——深度学习简介与入门示例

    OpenCV-Python实战(18)--深度学习简介与入门示例 0. 前言 1. 计算机视觉中的深度学习简介 1.1 深度学习的特点 1.2 深度学习大爆发 2. 用于图像分类的深度学习简介 3. ...

  8. 搭建智能语音交互系统重要点那些

    序言 随着人工智能命题的提出,近年来涌现出一大批基于人工智能的呼叫中心业务服务商和集成商,仅智能外呼这一模块儿就将近百家公司在推广和运营.可以说整个基于人工智能技术的市场开始蓬勃的发展起来了. 简单介 ...

  9. 《Python编程:从入门到实战》(第2版)学习笔记 第5章 if语句

    [写在前面]为进一步提高自己的python代码能力,打算把几本经典书籍重新过一遍,形成系统的知识体系,同时适当记录一些学习笔记,我尽量及时更新!先从经典的<Python编程:从入门到实战> ...

最新文章

  1. java 中的finally你知多少_Java 处理异常 9 个最佳实践,你知道几个?
  2. 沭阳县依托运用大数据推进平安建设
  3. 【FFMPEG】关于硬解码和软解码
  4. 【Linux系统编程】进程间通信--有名管道
  5. 微服务API设计的实践与思考总结
  6. 怎么理解ubuntu中的软件包管理器apt和dpkg
  7. Linux中 安装centos-release-scl 报错No package centos-release-scl available.
  8. 老人言 摘自云风的blog
  9. Linux之基本正则表达式(grep)
  10. hive的hql怎么运行_在Ubuntu上安装Apache Hive并运行HQL查询
  11. [Poi2000]公共串 hustoj2797
  12. 2020最新省市区县编码
  13. html制作清明上河图
  14. 升级win11后,觉得不好用想重装win10系统?教你重装win10“精简版”
  15. Realme GT 大师版 ROOT 解锁BL教程
  16. ctp服务器的出版文件在那里,ctp行情服务器地址
  17. 豆豆趣事[2013年09月]
  18. android 刷机动画,Android开机动画修改方法
  19. 226款H5手机端小游戏源码下载 - HTML+JavaScript开发的网页小游戏开源源码大合集,经过亲测可用!
  20. 笔记1:√2是无理数求证

热门文章

  1. C语言 scanf(“%c“)与空白字符
  2. 移动互联网 app盈利模式
  3. 【并查集】POJ 2524 Ubiquitous Religions
  4. 【正则表达式】Unity正则表达式
  5. 【FIW2022 精彩回顾】方正富邦基于超融合构建核心数据库资源池的探索与实践
  6. 【离散数学】第一章 笔记(完)
  7. 不平衡数据集处理方法
  8. 网页色彩搭配的几种常用颜色
  9. 如何用Java算出100的阶乘
  10. CentOS 7 修改网卡名称无法生效问题