利用树莓派制作智能音箱
制作智能音箱需要解决的问题,如下:
- 需要准备的器件(例如音箱、麦克风等)
- 代码实现问题(语音交互)
- 语音识别
- 语音唤醒功能
- 能够实现播放、暂停音乐(预先设好的音乐/链接网址播放在线)
- 讲故事、讲笑话(预先设好的故事和笑话/链接网址播放在线)
- 报天气(温湿度传感器设置范围对应天气/链接到对应网址汇报)
- 简单的对话:对应的问好+需要我为你做些什么吗?
- 实现技术:Python+百度接口
制作过程及调试阶段
- 完成百度接口注册及资源领取
- 语音合成的技术实现
- 根据百度智能云的步骤,在Python中一步步实现。
遇到的问题及解决方式:
在复制代码中,发现版本不兼容导致运行出现问题,我们所安装的python3.0版本无法找到urllib2(这是python2.7版本的用法),通过咨询老师和查阅百度了解到这个问题的来源,并通过删除兼容部分的代码解决了这一问题,实现了语音合成技术。
安装使用Python SDK有如下方式:
可在官网下载最新版本。
如果已安装pip,执行pip install baidu-aip即可,如果需要使用HTTP2,请安装pip install baidu-aip-http2。
如果已安装setuptools,执行python setup.py install即可。
- 语音识别的技术实现
根据百度智能云的步骤,在Python中一步步实现短语音的识别。
问题:如何实现实时语音识别
利用百度智能云开发的技术文档,安装基础调用软件。
实时语音识别接口采用websocket协议的连接方式,边上传音频边获取识别结果。可以将音频流实时识别为文字,也可以上传音频文件进行识别;返回结果包含每句话的开始和结束时间,适用于长句语音输入、音视频字幕、直播质检、会议记录等场景。
接入步骤:
1.创建账号
2.进行接口调用:实时语音识别支持websocket协议,API方式调用。
支持中文普通话、音视频直播(中文)场景识别;支持英文识别。
音频格式
目前只支持pcm格式的原始音频数据, 16000采样率, 单声道,16bits,小端序。 目前api限制一次音频时长不超过1小时。
音频内容为:清晰的真人发音,无背景音或其它噪音,日常用语。
录音环境
百度语音识别要求安静的环境,真人的正常语速的日常用语,并且不能多个人同时发音。
以下场景讲会导致识别效果变差,错误,甚至没有结果:
- 吵杂的环境
- 有背景音乐,包括扬声器在播放百度合成的语音。
- 离麦克风较远的场景应该选择远场语音识别。
以下场景的录音可能没有正确的识别结果:
- 音频里有技术专业名称或者用语
- 音频里是某个专业领域的对话,非日常用语。比如专业会议,动画片等
restapi http协议: 0.0s:--> 开始发起请求-->0.3s 发送完整录音文件到百度服务器 --> 3.0s: 接收返回结果
程序编写:
- 人机对话的实现
1. 新建机器人
在【我的机器人】页面,点击【创建我的机器人】,新建一个机器人。
创建完成之后,在技能管理页面添加技能到机器人中。
2. 添加技能到机器人中
a. 获取预置技能
点击【添加技能】页面,进入我的技能页面,点击【添加预置技能】,获取技能。
b. 获取闲聊技能
找到闲聊之后,点击【获取该技能】,跳转到我的闲聊页面,创建闲聊技能。
c. 将技能添加到机器人中
获取完技能后,回到刚刚创建的机器人中,点击【添加技能】,即可看到刚刚获取的两个预置技能,选中并添加到机器人中。
3. 对话流程控制
在机器人设置中使用回复优先级功能,可以控制各技能的回复优先级,数字越低,优先级越高。当用户与机器人对话时,会优先使用优先级更高的技能结果回复用户。平台默认使用优先级最高的技能结果,其他技能结果可测试窗口的json中看到。
4. 对话测试并部署
点击【对话】即可进行对话测试
测试完成后,点击【发布上线】即可接入业务系统。
程序编写:
ID是你自己的机器人代号。
然后导入树莓派。
给树莓派连上喇叭和麦克风,即可完成树莓派智能音箱的制作。
利用树莓派制作智能音箱相关推荐
- 【利用树莓派制作无线打印服务器】
利用树莓派制作无线打印服务器 文章目录 利用树莓派制作无线打印服务器 一.树莓派是什么? 二.什么是CUPS 树莓派如何启用CUPS 三.电脑端如何连接树莓派打印服务器? 四.手机如何连接树莓派打印服 ...
- 叮当:一个开源的树莓派中文智能音箱项目
这个项目其实来源于我生活中的一个需求:我每天晚上都会去厨房做一个面包当明天的早餐,当我把用料按顺序准备好放进面包机时,我需要准确预约到明天早上我吃早餐的时间.然而,几乎每次在这个时候我都没有带手机在身 ...
- 用Linux开发板制作智能音箱,【工程师实战】只要几步,普通音箱秒变小度智能音箱...
原标题:[工程师实战]只要几步,普通音箱秒变小度智能音箱 电子大改造来了,这次把家里的闲置音箱改造下,来个智能语音识别 这是普通的小音箱 我们需要在树莓派3B上搭载DuerOS的人工智能操作系统-度秘 ...
- OpenCV + 树莓派制作智能车【1】
前言 以前制作智能车都是在STM32上制作的,学习了一点OpenCV想要实践一下,一下就想到了买来一直在吃灰的树莓派,做一个智能小车吧! 黑线识别 我们先在Windows上写出基本能跑的检测代码: 首 ...
- 【简易广告机】利用树莓派制作一个简易的广告机(1)
利用树莓派做一个简单的广告机 废话不多说开始 1. 安装 omxplayer omxplayer 简易介绍:omxplayer是专门针对树莓派的GPU的播放器,支持硬件解码,最高支持分辨率是1080P ...
- 业余学python 树莓派_厉害了!小伙自学Python一个月,利用树莓派制作了黑客优盘工具!...
最近一直在学习Python爬虫,可能随着研究的深入,受到爬虫技术的感染,开始对获取别人的数据产生了兴趣,Python写网页爬虫是获取别人网站上的数据,那可不可以用Python写一个程序获取别人U盘上的 ...
- 利用树莓派制作天气闹钟
前言 为了能让刚买的树莓派有效的利用起来(避免吃灰),今天分享一下如何用树莓派做天气闹钟. 环境及工具 树莓派3B+.IDE.XShell.FileZilla(FTP文件上传).小音箱. 查询天气 准 ...
- 树莓派制作数字音箱--简易版
样板: 材料:树莓派,TPA3116D2,音箱 步骤:①配置树莓派 sudo apt-get -f install omxpl ...
- 使用树莓派制作智能小车
电影里,时不时地可以看到一些这样的场景,一辆小车,上面装有摄像头,这辆小车可以通过电脑或都是手机进行远程遥控,车上摄像头拍到的画面,可以实时地显示在电脑或手机上,就像下图这样. 没有接触过这方面的朋友 ...
最新文章
- WCF服务编程(4):《WCF服务编程》第3版中文版翻译结束,即将出版
- Angular-cli生成组件修改css成less或sass
- 看完王兴刷屏之后,你该学会建立属于自己的第一性原理
- OpenCV测量视频编码和解码的性能(附完整代码)
- 执行虚拟机mysql脚本_mysql一键执行脚本 超方便!!!
- android连接耳机时音量控制,android – 扬声器音量(闹钟)在插入耳机时会降低
- 局部变量写在循环内还是外_循环内的局部变量和性能
- excel合并多个工作表_多个工作表或者多个工作簿的合并计算
- 配置webpack.config.js遇到的一些问题
- JUnit-4.12使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误
- Linux查看、处理文件方法
- 有趣的算法(四)最通俗易懂的KMP算法解析
- P4145 上帝造题的七分钟2 / BZOJ3211花神游历各国
- Android CI with jenkins in ubuntu
- Windows系统C盘清理方案
- 局域网桌面共享会议该如何实现屏幕共享?
- 【工业大数据】工业大数据应用场景分析;工业大数据,从何做起
- FA-RPN: Floating Region Proposals for Face Detection(论文阅读笔记)
- 《置身事内》读书笔记第一章 地方政府的权利与事务
- python自动化看什么书_python自动化测试书籍
热门文章
- proteus中导入ST7920驱动的LCD12864模型
- spring 如何解决循环依赖
- 报错日志1:terminate called after throwing an instance of ‘ros::TimeNotInitializedException‘——ROS项目报错
- 027-2018-1015 服务端,客户端,socket
- 关于USB匹配电阻的一些疑问和解答
- vs code 插件 koroFileHeader
- 国钦智能科技携卫生级阀门管路管件解决方案,亮相2022生物发酵展
- 数字图像处理(九)图像分割之canny边缘检测
- MP4V2封装h265
- python schedule at_Python schedule 模块使用