搭建智能语音助手思路整理
目录
- 唤醒模块
- 录音模块
- 语音转文字
- 对话机器人
- 文字转语音
- 播放模块
- 主体控制模块
搭建一个智能语音助手可以大致分为一下几个模块
- 唤醒模块
- 录音模块
- 语音转文字
- 对话机器人
- 文字转语音
- 播放模块
- 主体控制模块
唤醒模块
- 唤醒唤醒模块一旦唤醒,暂时就不工作,唤醒工作结束后继续工作
- 唤醒之后检查网络状态
待选方案
snowboy
录音模块
一定时间内没有说话自动关闭,系统继续进入等待唤醒状态
一定时间内还在讲话,需要继续录音
录音时间过长提示用户暂停录音,否则继续下一步
录制完成的音频储存为wav格式,录音完成后录音模块停止工作
预选方案
Respeaker USB Mic Array + pyaudio
语音转文字
出错后根据不同的错误做出反馈,主要的错误有
- 返回空字符
- 网络错误
预选方案
百度语音识别 or 讯飞语音识别(免费调用量较多)
对话机器人
上传文字之后对话机器人会返回相应的文字,错误的处理同语音转文字部分相同
预选方案
tuling机器人 or 百度机器人
文字转语音
将对话机器人返回的文字转换成语音,主要涉及语音合成技术,百度讯飞等都有相应的api
预选方案
百度语音识别 or 讯飞语音识别(免费调用量较多)
播放模块
将语音播放出来
预选方案
扩音器
主体控制模块
- 当对话机器人回应唤醒人的时候是否进入下一轮的录音状态,或者是返回待唤醒状态
- 接入外设时可以从语音识别的文字中查询对应的关键字,然后处理
搭建智能语音助手思路整理相关推荐
- 如何快速搭建一个像“天猫精灵”的智能语音助手?
不看这几篇好文,就别说自己了解物联网 天猫精灵相信大家都不陌生了,它是阿里巴巴于2017年7月5日发布的AI智能终端品牌.让用户以自然语言对话的交互方式,实现影音娱乐.购物.信息查询.生活服务等功能操 ...
- 贴近司机,感知生活:智能语音助手在滴滴车主端的设计与实践
桔妹导读:基于网约车司机的职业特性,帮助与指引司机在各类复杂的场景下更安全.便捷地完成工作,并尽可能疏导与减轻他们因长时间处于封闭环境下的心理压力,一直是滴滴发力的一个方向.但现有的一些途径,如规则展 ...
- “智能语音助手”的竞品分析 —— 你好小悟小爱同学(2)
关于难点 技术: ASR: 对于ASR来说"远场"."纠错"."全双工"是3大难点: 在"远场"上,是智能音箱们需要优化 ...
- 爆肝一周,用Python在物联网设备上写了个智能语音助手
1. 背景介绍 智能语音助手作为物联网领域的一个重要生态成员,是一种全新的交互方式,它能够解放双手,随时提供服务,无须借助任何按键.想必很多开发者都有玩过天猫精灵.小爱同学或者小度吧,看到这些炫酷的人 ...
- 通过激光入侵Google智能语音助手
黑客可利用激光向智能语音助手发送看不见的指令. 近期,有研究人员发现,只需一束激光,就可以控制Alexa和Siri智能扬声器.攻击者不需要对受害者的设备进行物理接触,也不需要与受害者进行交互,只要攻击 ...
- 搭建智能语音交互系统
随着人工智能命题的提出,近年来涌现出一大批基于人工智能的呼叫中心业务服务商和集成商,仅智能外呼这一模块儿就将近百家公司在推广和运营.可以说整个基于人工智能技术的市场开始蓬勃的发展起来了. 简单介绍一下 ...
- Python语言打造智能语音助手——附完整源码
Python语言打造智能语音助手--附完整源码 随着智能家居.智能办公等领域的逐渐兴起,实现语音控制与交互已成为了一种趋势.而Python语言是一门极具魅力的编程语言,其强大的库.简洁的语法以及易于学 ...
- 华为云WeLink智能语音助手专题(中篇:怎么使用WeLink智能助手?)
华为云WeLink作为一款移动办公软件,内置小微语音助手,让我们看看小微可以做些什么: 找人何必点来点去?用小微一句话搞定 公司同事重名太多怕找错人?立马找到你想要的那个TA.对小微说:"找 ...
- 钻石与小度:智能语音助手背后的“马斯洛需求模型”
从软件到硬件,从辅助功能到产品核心,从前沿科技走向千万普通人的生活,智能语音助手的一路发展,经历了数次技术.形态.商业市场上的彻底蜕变.很多人都会好奇,智能语音助手的未来会走向何处? 其实这件事并不那 ...
- 亚马逊智能语音助手Alexa大举招聘 放出400个职位
今年5月,亚马逊CEO杰夫·贝索斯(Jeff Bezos)宣布,亚马逊将招聘1000多人,开发Echo智能音箱和Alexa智能语音助手.当时他表示:"这只是冰山一角." 根据Ale ...
最新文章
- Spring 自动化装配Bean
- 操作系统 chapter 12 死锁
- build.gradle里repositories的mavenCentral实现原理解析
- MySQL--安装linux(5.6版本)
- python全栈索引
- 深度学习数据集制作_一篇文章搞定人工智能之深度学习创建训练数据集的方法
- Codeforces Round #533 (Div. 2) 部分题解A~D
- 这打车App麻烦了!遭黑客勒索巨额比特币
- 学一点Wi-Fi:WAPI
- java 怎么把日期格式化时间_如何实现java日期格式化?
- videojs中文文档详解
- 微分方程和线性代数(先理解一阶微分形式不变性)
- God-Mz公益版秒赞系统源码
- BAT批处理判断是否是文件夹,是则遍历
- IPD的决策评审CDP(2):因地制宜,因时而动
- html方框打勾字段,word文档怎么输入带方框的对勾
- 主题美化 —— IAR篇
- 幕后产品_版本控制:幕后
- python算法技巧——列表、字符串实用技巧
- 秒表计时器怎么读_秒表使用说明书
热门文章
- css线条伸缩_CSS3弹性伸缩布局(上)——box布局
- java 视频边下边播_video src,如何边加载边播放?
- IDEA插件系列(94):Pomodoro-tm插件——番茄钟计时
- 智能暖风机——2.嵌入式系统创建
- 高级语言程序设计(c语言描述) 陆黎明 朱媛媛 练习答案,高级语言程序设计(c语言描述) 陆黎明 朱媛媛 练习答案...
- Myeclipse提示MyEclipse Trial Expired
- 计算机知识竞赛 翻译,英文简历之常见学科竞赛中英文翻译
- 安卓如何调出软键盘_Android软键盘-显示隐藏软键盘
- 类和对象3:组合和混入
- web项目运行时无法重命名MySQL表问题排查