人工智能之语音合成,语音识别
人工智能
此篇是人工智能应用的重点,只用现成的技术不做底层算法,也是让初级程序员快速进入人工智能行业的捷径
目前市面上主流的AI技术提供公司有很多,比如百度,阿里,腾讯,主做语音的科大讯飞,做只能问答的图灵机器人等等
这些公司投入了很大一部分财力物力人力将底层封装,提供应用接口给我们,尤其是百度,完全免费的接口
既然百度这么仗义,咱们就不要浪费掉怎么好的资源,从百度AI入手,开启人工智能之旅
开启人工智能技术的大门 : http://ai.baidu.com/
看看我大百度的AI大法,这些技术全部都是封装好的接口,看着就爽
接下来咱们就一步一步的操作一下
首先进入控制台,注册一个百度的账号(百度账号通用)
开通一下我们百度AI开放平台的授权
然后找到已开通服务中的百度语音
就可以创建应用了,回到应用列表我们可以看到已创建的应用了
安装百度的人工智能SDK:
首先咱们要 pip install baidu-aip 安装一个百度人工智能开放平台的Python SDK实在是太方便了,这也是为什么我们选择百度人工智能的最大原因
语音合成
其中参数:
这个时候audio.mp3就出来了,可以使用播放器播放,也可使用os模块调用os.steam(文件名)播放
语音识别:
哎,每次到这里,我都默默无语泪两行,声音这个东西格式太多样化了,如果要想让百度的SDK识别咱们的音频文件,就要想办法转变成百度SDK可以识别的格式PCM
目前DragonFire已知可以实现自动化转换格式并且屡试不爽的工具 : FFmpeg 这个工具的下载地址是 : 链接:https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg 密码:w6hk
FFmpeg 环境变量配置:
首先你要解压缩,然后找到bin目录,我的目录是 D:\python\ffmpeg-20180619-a990184-win64-shared\bin
尝试一下,是否配置成功
看到这个界面就算配置成功了,配置成功有什么用呢, 这个工具可以将wav wma mp3 等音频文件转换为 pcm 无压缩音频文件
做一个测试,首先要打开windows的录音机,录制一段音频(说普通话)
现在假设录制的音频文件的名字为 audio.wav 放置在 D:\kujiaweiAudio\
然后我们用命令行对这个 audio.wav 进行pcm格式的转换然后得到 audio.mp3
命令是 : ffmpeg -y -i audio.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 audio.pcm
其中参数:
运行结果如下:
转载于:https://www.cnblogs.com/kujiawei/p/10595170.html
人工智能之语音合成,语音识别相关推荐
- 人工智能 - 语音合成,语音识别,语音聊天机器人
目录 人工智能 - 语音合成,语音识别,语音聊天机器人 语音合成 语音识别 语音聊天机器人 人工智能 - 语音合成,语音识别,语音聊天机器人 现成的AI算法平台http://ai.baidu.com/ ...
- 人工智能时代,语音识别领域前景广阔
原标题:人工智能时代,语音识别领域前景广阔 当今,用"炙手可热"来形容AI人工智能再恰当不过,其也令全球科技界趋之若鹜,诸如谷歌.微软.苹果.IBM.Facebook.英特尔.中国 ...
- 亚马逊的人工智能将实时语音识别错误率降低了6.2%
据 Loup Ventures 不久前发布的2019年语音助理智商测试的结果,通过对每个人工智能系统的800个相同问题的测试,谷歌助手再次引领了这一潮流,与去年一样,100%完全理解了被问到的问题,并 ...
- 人工智能趋势:语音识别发展前景广阔
[导读]深度学习+大数据+并行计算共同推动了人工智能技术实现跨越式发展,"人工智能+"应用已开始落地开花-- 当今,用"炙手可热"来形容AI人工智能再恰当不过, ...
- 《人工智能》之语音识别小记
虽说有些不求甚解,我觉得<人工智能>这本书(王东 利节 许莎著 清华大学出版社)还是相当通俗易懂的,属于人工智能入门级读物. 本书从人工智能总论.人脸识别.语音识别.语言理解.行为模仿以及 ...
- 人工智能第一篇--语音识别和语音合成
1.什么是人工智能? 顾名思义就是由人创造的"智慧能力",具备听说看理解等能力. 听 ==语音识别 说 ==语音合成 看 ==图像视频文字识别 理解 ==语言(文字)图像视频理解等 ...
- 语音识别-人工智能实验室旗下语音识别频道,汇集最新最全的语音识别新闻及资讯,让您掌握语音识别第一手的资讯-中国人工智能网-Powered by www.AiLab.cn
声纹识别技术如何助力金融反欺诈? 语音识别2020-10-123027 我国金融业务下沉的同时,其风险也在不断扩张.各类金融机构,无论是银行.互联网金融平台,还是私募基金.保险等,都将面临愈发严峻的风 ...
- 《人工智能》之语音识别概述
文章目录 一.语音识别概述 二.语音识别简史 1.知识积累阶段(1930-1950) 2.模式匹配阶段(1950-1980) 3.统计模型阶段(1980-2000) 4.机器学习阶段(2000-201 ...
- 【人工智能】科大讯飞语音识别应用开发(第三集)
前言 这次需要对科大讯飞语音识别接口进行语音识别应用开发,前两次都是通过WebAPI调用接口,这次换一下,通过SDK调用接口 下面是开发的详细记录过程(基于前两次的基础上) 语音识别接口调用 第一步 ...
最新文章
- python读取邮件发送日期和时间_Python读取指定日期邮件的实例
- php常用的四种排序算法
- 普及几个小常识,新手技能补充
- VMware的屏幕太小
- 简单JS实现对表的行的增删
- org.xml.sax.SAXParseException: The string -- is not permitted within comments.
- java getidentifier_android – 如何使用getResource.getIdentifier()获取布局?
- 蓝桥 扫雷 java_Java实现 蓝桥杯VIP 算法提高 扫雷
- IDEA2018全局搜索中搜索jar包/lib
- 移动终端的应用杀掉进程后,接收消息启动应用的简要技术说明
- 1-7华为HCNA认证eNSP基础B
- 杭电多校(MINIEYE)第四场 补题
- Flutter实现google登陆(gmail)
- 【九度】题目1374:所有员工年龄排序
- java imageio temp_Java ImageIO.setUseCache方法代碼示例
- Windows 2000 单词表
- 思考一道题:非相邻数最大和
- 设备中LPC2368芯片个例参数问题导致故障的分析
- hibernate中 one to many和many to one的非主键关联
- React-18--css in js
热门文章
- 徐无忌并发编程笔记:无锁机制CAS及其底层实现原理?
- 让程序员心动的微瞬间(亲情篇)
- 历时5年打造开源芯片生态的一块拼图——SERVE平台
- Nos项目 ChannelInfo添加SKIP和FAV的图标
- 终于有人把数据挖掘讲明白了
- 苏嵌学习日志03 07.13
- Linux setup jdk environment
- Richard Hamming “You and your research“演讲正文
- 10月28日 考研英语学习任务
- 网站统计 开源 java_开源 java CMS - FreeCMS2.8 统计分析