制作智能音箱需要解决的问题,如下:

  1. 需要准备的器件(例如音箱、麦克风等)
  2. 代码实现问题(语音交互)
  1. 语音识别
  2. 语音唤醒功能
  3. 能够实现播放、暂停音乐(预先设好的音乐/链接网址播放在线)
  4. 讲故事、讲笑话(预先设好的故事和笑话/链接网址播放在线)
  5. 报天气(温湿度传感器设置范围对应天气/链接到对应网址汇报)
  6. 简单的对话:对应的问好+需要我为你做些什么吗?
  1. 实现技术:Python+百度接口

制作过程及调试阶段

  1. 完成百度接口注册及资源领取
  2. 语音合成的技术实现
  3. 根据百度智能云的步骤,在Python中一步步实现。

遇到的问题及解决方式:

在复制代码中,发现版本不兼容导致运行出现问题,我们所安装的python3.0版本无法找到urllib2(这是python2.7版本的用法),通过咨询老师和查阅百度了解到这个问题的来源,并通过删除兼容部分的代码解决了这一问题,实现了语音合成技术。

安装使用Python SDK有如下方式:

可在官网下载最新版本。

如果已安装pip,执行pip install baidu-aip即可,如果需要使用HTTP2,请安装pip install baidu-aip-http2。

如果已安装setuptools,执行python setup.py install即可。

  1. 语音识别的技术实现

根据百度智能云的步骤,在Python中一步步实现短语音的识别。

问题:如何实现实时语音识别

利用百度智能云开发的技术文档,安装基础调用软件。

实时语音识别接口采用websocket协议的连接方式,边上传音频边获取识别结果。可以将音频流实时识别为文字,也可以上传音频文件进行识别;返回结果包含每句话的开始和结束时间,适用于长句语音输入、音视频字幕、直播质检、会议记录等场景。

接入步骤:

1.创建账号

2.进行接口调用:实时语音识别支持websocket协议,API方式调用。

支持中文普通话、音视频直播(中文)场景识别;支持英文识别。

音频格式

目前只支持pcm格式的原始音频数据, 16000采样率, 单声道,16bits,小端序。 目前api限制一次音频时长不超过1小时。

音频内容为:清晰的真人发音,无背景音或其它噪音,日常用语。

录音环境

百度语音识别要求安静的环境,真人的正常语速的日常用语,并且不能多个人同时发音。

以下场景讲会导致识别效果变差,错误,甚至没有结果:

  1. 吵杂的环境
  2. 有背景音乐,包括扬声器在播放百度合成的语音。
  3. 离麦克风较远的场景应该选择远场语音识别。

以下场景的录音可能没有正确的识别结果:

  1. 音频里有技术专业名称或者用语
  2. 音频里是某个专业领域的对话,非日常用语。比如专业会议,动画片等

restapi http协议: 0.0s:--> 开始发起请求-->0.3s 发送完整录音文件到百度服务器 --> 3.0s: 接收返回结果

程序编写:

  1. 人机对话的实现

1. 新建机器人

  在【我的机器人】页面,点击【创建我的机器人】,新建一个机器人。

  创建完成之后,在技能管理页面添加技能到机器人中。

2. 添加技能到机器人中

a. 获取预置技能

  点击【添加技能】页面,进入我的技能页面,点击【添加预置技能】,获取技能。

b. 获取闲聊技能

  找到闲聊之后,点击【获取该技能】,跳转到我的闲聊页面,创建闲聊技能。

c. 将技能添加到机器人中

  获取完技能后,回到刚刚创建的机器人中,点击【添加技能】,即可看到刚刚获取的两个预置技能,选中并添加到机器人中。

3. 对话流程控制

  在机器人设置中使用回复优先级功能,可以控制各技能的回复优先级,数字越低,优先级越高。当用户与机器人对话时,会优先使用优先级更高的技能结果回复用户。平台默认使用优先级最高的技能结果,其他技能结果可测试窗口的json中看到。

4. 对话测试并部署

  点击【对话】即可进行对话测试

测试完成后,点击【发布上线】即可接入业务系统。

程序编写:

ID是你自己的机器人代号。

然后导入树莓派。

给树莓派连上喇叭和麦克风,即可完成树莓派智能音箱的制作。

利用树莓派制作智能音箱相关推荐

  1. 【利用树莓派制作无线打印服务器】

    利用树莓派制作无线打印服务器 文章目录 利用树莓派制作无线打印服务器 一.树莓派是什么? 二.什么是CUPS 树莓派如何启用CUPS 三.电脑端如何连接树莓派打印服务器? 四.手机如何连接树莓派打印服 ...

  2. 叮当:一个开源的树莓派中文智能音箱项目

    这个项目其实来源于我生活中的一个需求:我每天晚上都会去厨房做一个面包当明天的早餐,当我把用料按顺序准备好放进面包机时,我需要准确预约到明天早上我吃早餐的时间.然而,几乎每次在这个时候我都没有带手机在身 ...

  3. 用Linux开发板制作智能音箱,【工程师实战】只要几步,普通音箱秒变小度智能音箱...

    原标题:[工程师实战]只要几步,普通音箱秒变小度智能音箱 电子大改造来了,这次把家里的闲置音箱改造下,来个智能语音识别 这是普通的小音箱 我们需要在树莓派3B上搭载DuerOS的人工智能操作系统-度秘 ...

  4. OpenCV + 树莓派制作智能车【1】

    前言 以前制作智能车都是在STM32上制作的,学习了一点OpenCV想要实践一下,一下就想到了买来一直在吃灰的树莓派,做一个智能小车吧! 黑线识别 我们先在Windows上写出基本能跑的检测代码: 首 ...

  5. 【简易广告机】利用树莓派制作一个简易的广告机(1)

    利用树莓派做一个简单的广告机 废话不多说开始 1. 安装 omxplayer omxplayer 简易介绍:omxplayer是专门针对树莓派的GPU的播放器,支持硬件解码,最高支持分辨率是1080P ...

  6. 业余学python 树莓派_厉害了!小伙自学Python一个月,利用树莓派制作了黑客优盘工具!...

    最近一直在学习Python爬虫,可能随着研究的深入,受到爬虫技术的感染,开始对获取别人的数据产生了兴趣,Python写网页爬虫是获取别人网站上的数据,那可不可以用Python写一个程序获取别人U盘上的 ...

  7. 利用树莓派制作天气闹钟

    前言 为了能让刚买的树莓派有效的利用起来(避免吃灰),今天分享一下如何用树莓派做天气闹钟. 环境及工具 树莓派3B+.IDE.XShell.FileZilla(FTP文件上传).小音箱. 查询天气 准 ...

  8. 树莓派制作数字音箱--简易版

    样板:                                      材料:树莓派,TPA3116D2,音箱 步骤:①配置树莓派 sudo apt-get -f install omxpl ...

  9. 使用树莓派制作智能小车

    电影里,时不时地可以看到一些这样的场景,一辆小车,上面装有摄像头,这辆小车可以通过电脑或都是手机进行远程遥控,车上摄像头拍到的画面,可以实时地显示在电脑或手机上,就像下图这样. 没有接触过这方面的朋友 ...

最新文章

  1. WCF服务编程(4):《WCF服务编程》第3版中文版翻译结束,即将出版
  2. Angular-cli生成组件修改css成less或sass
  3. 看完王兴刷屏之后,你该学会建立属于自己的第一性原理
  4. OpenCV测量视频编码和解码的性能(附完整代码)
  5. 执行虚拟机mysql脚本_mysql一键执行脚本 超方便!!!
  6. android连接耳机时音量控制,android – 扬声器音量(闹钟)在插入耳机时会降低
  7. 局部变量写在循环内还是外_循环内的局部变量和性能
  8. excel合并多个工作表_多个工作表或者多个工作簿的合并计算
  9. 配置webpack.config.js遇到的一些问题
  10. JUnit-4.12使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误
  11. Linux查看、处理文件方法
  12. 有趣的算法(四)最通俗易懂的KMP算法解析
  13. P4145 上帝造题的七分钟2 / BZOJ3211花神游历各国
  14. Android CI with jenkins in ubuntu
  15. Windows系统C盘清理方案
  16. 局域网桌面共享会议该如何实现屏幕共享?
  17. 【工业大数据】工业大数据应用场景分析;工业大数据,从何做起
  18. FA-RPN: Floating Region Proposals for Face Detection(论文阅读笔记)
  19. 《置身事内》读书笔记第一章 地方政府的权利与事务
  20. python自动化看什么书_python自动化测试书籍

热门文章

  1. proteus中导入ST7920驱动的LCD12864模型
  2. spring 如何解决循环依赖
  3. 报错日志1:terminate called after throwing an instance of ‘ros::TimeNotInitializedException‘——ROS项目报错
  4. 027-2018-1015 服务端,客户端,socket
  5. 关于USB匹配电阻的一些疑问和解答
  6. vs code 插件 koroFileHeader
  7. 国钦智能科技携卫生级阀门管路管件解决方案,亮相2022生物发酵展
  8. 数字图像处理(九)图像分割之canny边缘检测
  9. MP4V2封装h265
  10. python schedule at_Python schedule 模块使用