目录

  • 唤醒模块
  • 录音模块
  • 语音转文字
  • 对话机器人
  • 文字转语音
  • 播放模块
  • 主体控制模块

搭建一个智能语音助手可以大致分为一下几个模块

  • 唤醒模块
  • 录音模块
  • 语音转文字
  • 对话机器人
  • 文字转语音
  • 播放模块
  • 主体控制模块

唤醒模块

  1. 唤醒唤醒模块一旦唤醒,暂时就不工作,唤醒工作结束后继续工作
  2. 唤醒之后检查网络状态

待选方案

snowboy

录音模块

  1. 一定时间内没有说话自动关闭,系统继续进入等待唤醒状态

  2. 一定时间内还在讲话,需要继续录音

    录音时间过长提示用户暂停录音,否则继续下一步

  3. 录制完成的音频储存为wav格式,录音完成后录音模块停止工作

预选方案

Respeaker USB Mic Array + pyaudio

语音转文字

出错后根据不同的错误做出反馈,主要的错误有

  • 返回空字符
  • 网络错误
    预选方案

百度语音识别 or 讯飞语音识别(免费调用量较多)

对话机器人

上传文字之后对话机器人会返回相应的文字,错误的处理同语音转文字部分相同

预选方案

tuling机器人 or 百度机器人

文字转语音

将对话机器人返回的文字转换成语音,主要涉及语音合成技术,百度讯飞等都有相应的api

预选方案

百度语音识别 or 讯飞语音识别(免费调用量较多)

播放模块

将语音播放出来

预选方案

扩音器

主体控制模块

  • 当对话机器人回应唤醒人的时候是否进入下一轮的录音状态,或者是返回待唤醒状态
  • 接入外设时可以从语音识别的文字中查询对应的关键字,然后处理

搭建智能语音助手思路整理相关推荐

  1. 如何快速搭建一个像“天猫精灵”的智能语音助手?

    不看这几篇好文,就别说自己了解物联网 天猫精灵相信大家都不陌生了,它是阿里巴巴于2017年7月5日发布的AI智能终端品牌.让用户以自然语言对话的交互方式,实现影音娱乐.购物.信息查询.生活服务等功能操 ...

  2. 贴近司机,感知生活:智能语音助手在滴滴车主端的设计与实践

    桔妹导读:基于网约车司机的职业特性,帮助与指引司机在各类复杂的场景下更安全.便捷地完成工作,并尽可能疏导与减轻他们因长时间处于封闭环境下的心理压力,一直是滴滴发力的一个方向.但现有的一些途径,如规则展 ...

  3. “智能语音助手”的竞品分析 —— 你好小悟小爱同学(2)

    关于难点 技术: ASR: 对于ASR来说"远场"."纠错"."全双工"是3大难点: 在"远场"上,是智能音箱们需要优化 ...

  4. 爆肝一周,用Python在物联网设备上写了个智能语音助手

    1. 背景介绍 智能语音助手作为物联网领域的一个重要生态成员,是一种全新的交互方式,它能够解放双手,随时提供服务,无须借助任何按键.想必很多开发者都有玩过天猫精灵.小爱同学或者小度吧,看到这些炫酷的人 ...

  5. 通过激光入侵Google智能语音助手

    黑客可利用激光向智能语音助手发送看不见的指令. 近期,有研究人员发现,只需一束激光,就可以控制Alexa和Siri智能扬声器.攻击者不需要对受害者的设备进行物理接触,也不需要与受害者进行交互,只要攻击 ...

  6. 搭建智能语音交互系统

    随着人工智能命题的提出,近年来涌现出一大批基于人工智能的呼叫中心业务服务商和集成商,仅智能外呼这一模块儿就将近百家公司在推广和运营.可以说整个基于人工智能技术的市场开始蓬勃的发展起来了. 简单介绍一下 ...

  7. Python语言打造智能语音助手——附完整源码

    Python语言打造智能语音助手--附完整源码 随着智能家居.智能办公等领域的逐渐兴起,实现语音控制与交互已成为了一种趋势.而Python语言是一门极具魅力的编程语言,其强大的库.简洁的语法以及易于学 ...

  8. 华为云WeLink智能语音助手专题(中篇:怎么使用WeLink智能助手?)

    华为云WeLink作为一款移动办公软件,内置小微语音助手,让我们看看小微可以做些什么: 找人何必点来点去?用小微一句话搞定 公司同事重名太多怕找错人?立马找到你想要的那个TA.对小微说:"找 ...

  9. 钻石与小度:智能语音助手背后的“马斯洛需求模型”

    从软件到硬件,从辅助功能到产品核心,从前沿科技走向千万普通人的生活,智能语音助手的一路发展,经历了数次技术.形态.商业市场上的彻底蜕变.很多人都会好奇,智能语音助手的未来会走向何处? 其实这件事并不那 ...

  10. 亚马逊智能语音助手Alexa大举招聘 放出400个职位

    今年5月,亚马逊CEO杰夫·贝索斯(Jeff Bezos)宣布,亚马逊将招聘1000多人,开发Echo智能音箱和Alexa智能语音助手.当时他表示:"这只是冰山一角." 根据Ale ...

最新文章

  1. Spring 自动化装配Bean
  2. 操作系统 chapter 12 死锁
  3. build.gradle里repositories的mavenCentral实现原理解析
  4. MySQL--安装linux(5.6版本)
  5. python全栈索引
  6. 深度学习数据集制作_一篇文章搞定人工智能之深度学习创建训练数据集的方法
  7. Codeforces Round #533 (Div. 2) 部分题解A~D
  8. 这打车App麻烦了!遭黑客勒索巨额比特币
  9. 学一点Wi-Fi:WAPI
  10. java 怎么把日期格式化时间_如何实现java日期格式化?
  11. videojs中文文档详解
  12. 微分方程和线性代数(先理解一阶微分形式不变性)
  13. God-Mz公益版秒赞系统源码
  14. BAT批处理判断是否是文件夹,是则遍历
  15. IPD的决策评审CDP(2):因地制宜,因时而动
  16. html方框打勾字段,word文档怎么输入带方框的对勾
  17. 主题美化 —— IAR篇
  18. 幕后产品_版本控制:幕后
  19. python算法技巧——列表、字符串实用技巧
  20. 秒表计时器怎么读_秒表使用说明书

热门文章

  1. css线条伸缩_CSS3弹性伸缩布局(上)——box布局
  2. java 视频边下边播_video src,如何边加载边播放?
  3. IDEA插件系列(94):Pomodoro-tm插件——番茄钟计时
  4. 智能暖风机——2.嵌入式系统创建
  5. 高级语言程序设计(c语言描述) 陆黎明 朱媛媛 练习答案,高级语言程序设计(c语言描述) 陆黎明 朱媛媛 练习答案...
  6. Myeclipse提示MyEclipse Trial Expired
  7. 计算机知识竞赛 翻译,英文简历之常见学科竞赛中英文翻译
  8. 安卓如何调出软键盘_Android软键盘-显示隐藏软键盘
  9. 类和对象3:组合和混入
  10. web项目运行时无法重命名MySQL表问题排查