为什么傅里叶一定要实现它?如此执着?你一定感受过声控灯的神奇,缺什么,补什么,想要的‘糖’,吃在嘴里,甜在心里,这个‘糖’,不用买,可以自己造出来,原来天下有这么神奇的事情(小孩子最喜欢,我也喜欢),所以让声控灯更进一步,怀揣这个想法。

曾有一个抄写成功的vc++版本的采集声音的程序,有十年了,后来又打通了局域网(lan)内网口通信,顺便合二为一,写了一个聊天程序,更进一步,既然一楼的电视声音被传到二楼(预设双工通信,只能通过鼠标按钮切换实现双工,未找到原因),能否传图像呢?一直未实现,工作几年后,当你想起,原来的程序,怎么也找不到了,想想当时那下的心血啊,可惜了(也不可惜,踏进了vc++的大门)!这到来的AI时代,自己的图像处理技术也日臻完善(拜赐于机器视觉工作),写一个lan内的声视通信的程序没那么初心般渴望了(这是不是对QQ的潜意识呢?),转而想到了语音能否开关灯呢?于是乎!一发不可收拾。本来要识别一些自己的语音如:大,大,大;小,小,小(有没有想到孙大圣的金箍棒,我用它响应放大缩小图像);开,关之类的,实现后(这个版本主要使用图像匹配技术),转向爸爸,妈妈,姑姑,舅舅,a,o,e,i,u,ǖ和一二一的识别(这个版本起了个名字叫钨音传说),实现后,其实都是半桶水,发音到了频道,ok,不在频道,即使同音,累死你,就是不出来,再加上噪音和白噪音干扰,晚上感觉特好,成功率极高,有没有好方法?准确率高一些呢?终于,轮到傅里叶登场了(怎么想到傅里叶的呢?上学的时候,曾经狼吞虎咽一本书,梁之安先生著述的《听觉感受和辨别的神经机制》,现在才开始消化),我滴个神啊!人生的曙光照了进来,只要你想到了,其他都不是问题,关键是灵感到了,就像李白遇到杜甫。

就一个难题,攻下傅里叶,十年了,真是闻名不如见面,该补未学之课了!

语音识别中,潜意识使用了图像处理的匹配识别技术,但,就是不理想!不曾想误打误撞通关了一维傅里叶变换,二维在图像处理中用的更广泛,但一般都是分解成行列两个一维傅里叶加快速度处理的(他们说visionpro中,未使用傅里叶是有道理的),看来自己的图像处理【二维像素矩阵】又可以再迈一步了。

等搞定傅里叶,用上傅里叶,也不理想,最后在标准化(归一化)输入的启示下,通过音乐的方式,发现了窍门,所谓标准化(归一化),你是否想到一个英文单词Normal(正态分布),是的,他实质表达了两层意思,一,突出特征,二,normal统计分离出来。其实并非一定要懂正态(高斯)分布,人所用的东西,不一定要数学化(能数学表达,更好),你看,中国人用了两千年的中庸,是否涵盖了正态分布和归一化思想,语言和习惯几千年不变的,这也叫真理,只不过我们习惯了真理用数学表达的方式,习惯一种方式,要变化为另一种方式,很难!借用上海重音口琴,终于可以准确识别了,do,re,mi,fa,sou,la,xi,长路漫漫啊!

我发现归一化思想好像没有在课本里被重复强调过,但在人工智能时代,归一化思想会散落在正态(高斯)分布里,马氏距离里,最小二乘法里,我还在直方图均衡化里见到了他的影子,以及在点积归一化矢量数学的应用(游戏编程中用来快速识别智能体方向)里。归一化正是很多AI算法抽象的形象语言的表达。

做过一次测试,用口琴演奏欢乐颂(贝多芬),识别了22个音,成功19个,了不起啊!这是从0到1的突破。无人师导,真是柳暗花明,峰回路转。古人云,活到老,学到老,若古人遇到这样的专业,一定是符合他们审美的。曾在工作中遇到比肩我父亲年龄的日本人出差公司,指导我们工作,熟练的写着程序,还带着一个跟学13年的徒弟,真是佩服啊!(惭愧啊!)想想我们中国,正在给程序员定义一个四十岁的笼子,多么可怕!(想写就写,写他个天荒地老!)

可以肯定的是,语音识别中使用的图像匹配识别技术和傅里叶匹配技术,是最接近语音识别成功的技术,若在语音(语言)归一化上下功夫,指日可待。

AI其实可以很简单,编程这么多年,若有一个算法是自己的,真的很了不起,但你的少算法的程序就是AI,简单中蕴藏着AI,你比如微软mfc中类的自动生成,文本中搜索关键字,再比如编程中的类和函数提示技术,细细思来,坦然就好,没有思考的追逐,很容易迷失,你再比如,我们设计的线图像工具,这是机器视觉的支撑,这些都是高中掌握的知识就可以搞定,算法看似高大上,在细节上,失败是平等的,而有一种并行,就像耳朵和眼睛,夸大任何一样都不妥。

识别到,靠眼和耳这样熟练熟悉的平台,也只是万里长征第一步,但我们需要这一步,这是0到1的第一步,而在加上头脑风暴(烧脑),才会有一丝丝前行。

不积跬步,无以至千里。千里之行,始于脚下。回头我们从采集声音程序说起。

待续(慢慢来!...........)每天一点小改变☺

我的邮箱liuganggang_1978@163.com;734523623@qq.com

人工智能(AI)入门---傅里叶语音识别项目(发端)相关推荐

  1. 人工智能(AI)入门---傅里叶语音识别项目(全家福)

    通过前面的介绍,我们傅里叶语音识别项目的技术已经全部到位,这一节贴出全家福,看一看图像,捋清思路,知道怎么去做,以供参考,第一幅:假fft1920(假wu音),这里加载的是yi(壹)音的特征头,fft ...

  2. 【人工智能】观看人工智能 (AI) 入门课程,一起来看看都讲了什么

    作者:小5聊 简介:一只喜欢全栈方向的程序员,欢迎咨询,尽绵薄之力答疑解惑 目录 1.课程介绍 2.适用人群 3. 讲师Dan Mbanga 4.机器学习认识功能 5.什么是AI 6.AI 依赖于知识 ...

  3. AI专题:第一章 人工智能之入门基本方法

    眼下,人工智能已经成为越来越火的一个方向.普通程序员,如何转向人工智能方向,是知乎上的一个问题.本文是我对此问题的一个回答的归档版.相比原回答有所内容增加. 一.目的 本文的目的是给出一个简单的,平滑 ...

  4. 学人工智能要看什么书?AI入门到进阶10本必看书

    学习人工智能可以从多个方面入手,从基础到进阶,不同的书籍可以帮助你建立不同的技能和知识体系.以下是我推荐的10本必看书: 学人工智能要看什么书?AI入门到进阶10本必看书 <Python编程从入 ...

  5. 精品收藏:GitHub人工智能AI开源项目

    精品收藏:GitHub人工智能AI开源项目 绝对精品!!!花了点时间,鄙人把这几年收藏的开源精品项目,整理一下,方面以后查找.其中涵盖了姿态检测,图像分割,图像分类,美学评价.人脸识别.多尺度训练,移 ...

  6. 合适学习人工智能的小白的一本书《极简AI入门:一本书读懂人工智能思维与应用》

    今天看了一本书<极简AI入门:一本书读懂人工智能思维与应用> 对于初学人工智能的小白来说,应该是非常容易看得懂的,书里罗列了人工智能需要学习的各个技能,可以把这本书当作学习人工智能的目录( ...

  7. 零基础入门 Python 人工智能 (Ai)

    零基础入门 Python & 人工智能 (Ai) - 第 001 讲 真正的零基础!专为"从没接触过编程的小白"打造!一站式学习! 分分钟搞定数学.编程.算法等人工智能研发 ...

  8. 人工智能ai的有关专业术语_您需要知道的11个人工智能术语

    人工智能ai的有关专业术语 "Any fool can know. The point is to understand." - Albert Einstein "任何傻 ...

  9. 【慕课网】人工智能-语音入门|公开课知识整理

    人工智能-语音入门 该博客是慕课网视频教程的笔者自我小结,原视频传送门 References: 语音增强理论与实践-[美]罗艾洲等 [译]高毅等 WAV和PCM的关系和区别 AudioSet数据集 知 ...

最新文章

  1. 乐观锁和悲观锁,可重入锁和不可重入锁(1)
  2. Java微服务(一)【idea安装2020版本】
  3. Eclipse ADT环境、Android studio如何连接外部安卓模拟器
  4. STM32串口通信UARTx
  5. ps技巧学习之常用8种抠图方法
  6. pic32用PICKIT3烧写bootloader
  7. Cannot access a disposed context instance. A common cause of this error is disposing a context insta
  8. 高德地图 地图点击获取经纬度,经纬度格式判断
  9. 人机对战五子棋(权值法)
  10. 计算机指令包括哪2部分,机器指令分为哪几部分
  11. 基于JAVA出差报销管理系统
  12. 如何利用XGen制作头发,发片-笔记
  13. Visitor パターン
  14. Linux基础命令-进程与系统性能
  15. linux离线安装snap应用,Ubuntu使用snap安装常用软件
  16. Python学习笔记(一)压缩与解压缩文件
  17. CNN结构的演变+几种典型的网络介绍+CNN设计准则
  18. 利用python进入数据分析之usagov_bitly_data数据分析
  19. HDU—— 1290 献给杭电五十周年校庆的礼物
  20. 算法刷题系列(四)蓝桥杯python算法训练3(下)

热门文章

  1. 如何将Oracle中同一列的多行记录拼接成一个字符串
  2. C++: 计算累积密度函数 (CDF) 非中心贝塔分布(附完整源码)
  3. 基础篇(6) splash应用
  4. 心泰医疗通过上市聆讯:上半年增收不增利,蒲忠杰为控股股东
  5. Java小程序之计算三角形/圆形/矩形的周长和面积
  6. html页面中文显示乱码问题解决方法
  7. 1,2-二苯基-1,2-二(4-苄溴基苯基)乙烯;TPE-MB结构式
  8. 【实践技巧】下载网页视频小tip
  9. web安全测试服务开展流程简介
  10. 微型计算机常用的worm是,具有多媒体功能的微型计算机系统中,常用的的WORM是()A.只读型大容量软盘B.只读型光盘C.一次性写...