人工智能

此篇是人工智能应用的重点,只用现成的技术不做底层算法,也是让初级程序员快速进入人工智能行业的捷径

目前市面上主流的AI技术提供公司有很多,比如百度,阿里,腾讯,主做语音的科大讯飞,做只能问答的图灵机器人等等

这些公司投入了很大一部分财力物力人力将底层封装,提供应用接口给我们,尤其是百度,完全免费的接口

既然百度这么仗义,咱们就不要浪费掉怎么好的资源,从百度AI入手,开启人工智能之旅

开启人工智能技术的大门 : http://ai.baidu.com/

看看我大百度的AI大法,这些技术全部都是封装好的接口,看着就爽

接下来咱们就一步一步的操作一下

首先进入控制台,注册一个百度的账号(百度账号通用)

开通一下我们百度AI开放平台的授权

然后找到已开通服务中的百度语音

就可以创建应用了,回到应用列表我们可以看到已创建的应用了

安装百度的人工智能SDK:

首先咱们要 pip install baidu-aip 安装一个百度人工智能开放平台的Python SDK实在是太方便了,这也是为什么我们选择百度人工智能的最大原因

语音合成

其中参数:

这个时候audio.mp3就出来了,可以使用播放器播放,也可使用os模块调用os.steam(文件名)播放

语音识别:

哎,每次到这里,我都默默无语泪两行,声音这个东西格式太多样化了,如果要想让百度的SDK识别咱们的音频文件,就要想办法转变成百度SDK可以识别的格式PCM

目前DragonFire已知可以实现自动化转换格式并且屡试不爽的工具 : FFmpeg 这个工具的下载地址是 : 链接:https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg 密码:w6hk

FFmpeg 环境变量配置:

首先你要解压缩,然后找到bin目录,我的目录是 D:\python\ffmpeg-20180619-a990184-win64-shared\bin

尝试一下,是否配置成功

看到这个界面就算配置成功了,配置成功有什么用呢, 这个工具可以将wav wma mp3 等音频文件转换为 pcm 无压缩音频文件

做一个测试,首先要打开windows的录音机,录制一段音频(说普通话)

现在假设录制的音频文件的名字为 audio.wav 放置在 D:\kujiaweiAudio\

然后我们用命令行对这个 audio.wav 进行pcm格式的转换然后得到 audio.mp3

命令是 : ffmpeg -y  -i audio.mp3  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 audio.pcm

其中参数:

运行结果如下:

转载于:https://www.cnblogs.com/kujiawei/p/10595170.html

人工智能之语音合成,语音识别相关推荐

  1. 人工智能 - 语音合成,语音识别,语音聊天机器人

    目录 人工智能 - 语音合成,语音识别,语音聊天机器人 语音合成 语音识别 语音聊天机器人 人工智能 - 语音合成,语音识别,语音聊天机器人 现成的AI算法平台http://ai.baidu.com/ ...

  2. 人工智能时代,语音识别领域前景广阔

    原标题:人工智能时代,语音识别领域前景广阔 当今,用"炙手可热"来形容AI人工智能再恰当不过,其也令全球科技界趋之若鹜,诸如谷歌.微软.苹果.IBM.Facebook.英特尔.中国 ...

  3. 亚马逊的人工智能将实时语音识别错误率降低了6.2%

    据 Loup Ventures 不久前发布的2019年语音助理智商测试的结果,通过对每个人工智能系统的800个相同问题的测试,谷歌助手再次引领了这一潮流,与去年一样,100%完全理解了被问到的问题,并 ...

  4. 人工智能趋势:语音识别发展前景广阔

    [导读]深度学习+大数据+并行计算共同推动了人工智能技术实现跨越式发展,"人工智能+"应用已开始落地开花-- 当今,用"炙手可热"来形容AI人工智能再恰当不过, ...

  5. 《人工智能》之语音识别小记

    虽说有些不求甚解,我觉得<人工智能>这本书(王东 利节 许莎著 清华大学出版社)还是相当通俗易懂的,属于人工智能入门级读物. 本书从人工智能总论.人脸识别.语音识别.语言理解.行为模仿以及 ...

  6. 人工智能第一篇--语音识别和语音合成

    1.什么是人工智能? 顾名思义就是由人创造的"智慧能力",具备听说看理解等能力. 听 ==语音识别 说 ==语音合成 看 ==图像视频文字识别 理解 ==语言(文字)图像视频理解等 ...

  7. 语音识别-人工智能实验室旗下语音识别频道,汇集最新最全的语音识别新闻及资讯,让您掌握语音识别第一手的资讯-中国人工智能网-Powered by www.AiLab.cn

    声纹识别技术如何助力金融反欺诈? 语音识别2020-10-123027 我国金融业务下沉的同时,其风险也在不断扩张.各类金融机构,无论是银行.互联网金融平台,还是私募基金.保险等,都将面临愈发严峻的风 ...

  8. 《人工智能》之语音识别概述

    文章目录 一.语音识别概述 二.语音识别简史 1.知识积累阶段(1930-1950) 2.模式匹配阶段(1950-1980) 3.统计模型阶段(1980-2000) 4.机器学习阶段(2000-201 ...

  9. 【人工智能】科大讯飞语音识别应用开发(第三集)

    前言 这次需要对科大讯飞语音识别接口进行语音识别应用开发,前两次都是通过WebAPI调用接口,这次换一下,通过SDK调用接口 下面是开发的详细记录过程(基于前两次的基础上) 语音识别接口调用 第一步 ...

最新文章

  1. python读取邮件发送日期和时间_Python读取指定日期邮件的实例
  2. php常用的四种排序算法
  3. 普及几个小常识,新手技能补充
  4. VMware的屏幕太小
  5. 简单JS实现对表的行的增删
  6. org.xml.sax.SAXParseException: The string -- is not permitted within comments.
  7. java getidentifier_android – 如何使用getResource.getIdentifier()获取布局?
  8. 蓝桥 扫雷 java_Java实现 蓝桥杯VIP 算法提高 扫雷
  9. IDEA2018全局搜索中搜索jar包/lib
  10. 移动终端的应用杀掉进程后,接收消息启动应用的简要技术说明
  11. 1-7华为HCNA认证eNSP基础B
  12. 杭电多校(MINIEYE)第四场 补题
  13. Flutter实现google登陆(gmail)
  14. 【九度】题目1374:所有员工年龄排序
  15. java imageio temp_Java ImageIO.setUseCache方法代碼示例
  16. Windows 2000 单词表
  17. 思考一道题:非相邻数最大和
  18. 设备中LPC2368芯片个例参数问题导致故障的分析
  19. hibernate中 one to many和many to one的非主键关联
  20. React-18--css in js

热门文章

  1. 徐无忌并发编程笔记:无锁机制CAS及其底层实现原理?
  2. 让程序员心动的微瞬间(亲情篇)
  3. 历时5年打造开源芯片生态的一块拼图——SERVE平台
  4. Nos项目 ChannelInfo添加SKIP和FAV的图标
  5. 终于有人把数据挖掘讲明白了
  6. 苏嵌学习日志03 07.13
  7. Linux setup jdk environment
  8. Richard Hamming “You and your research“演讲正文
  9. 10月28日 考研英语学习任务
  10. 网站统计 开源 java_开源 java CMS - FreeCMS2.8 统计分析