https://www.toutiao.com/a6700847812566843911/

AI与神经网络

人工智能已经发展了六七十年,经历了几度繁荣和衰落。虽然已取得不错的进展,但是与理想中的人工智能差距还是很大。

人工智能三大学派:符号学派、连接学派、行为学派。符号学派认为,任何能够将物理的某些模式或符号进行操作并转化成另外一些模式或符号的系统,就可能产生智能行为;连接学派认为高级的智能行为是从大量神经网络的连接中自发出现的,通过大量神经元来模拟大脑;行为学派并没有把目光聚焦到高级智能的人类身上,而是关注低级的昆虫能灵活走动并快速反应。上世纪的八九十年代形成三足鼎立的形势。

这几年再度让人工智能火起来的是连接学派,连接学派通过深度学习将以往很多领域的表现都大幅提高,连接方式无疑已经成为目前最闪耀的人工智能解决方案。连接派的模型都是以神经网络为基础进行创新的,所以核心部分仍然是神经网络结构。

关于分类

人类对事物的识别其实很大程度就是对事物进行分类。就好比下面图中的各种花,我们看到桔梗时就知道它是一种花,看到曼陀罗时也认为它是一种花,看到不同的花我们都对它们进行分类。类似的还有人、树、汽车等等,都属于分类概念,当看到相应事物时都会对其进行分类。

分类是人工智能的核心部分,神经网络则可以实现像人类这样的识别分类能力。对于机器来说,所有信息都是用离散的数字信号来表征的,神经网络的目标就是通过这些离散的信号来进行分类从而达到识别效果。

最简神经网络

感知器是最基础的神经网络,它可以有多个输入(x1,x2,…xn),每个输入对应有一个权重(w1,w2…wn),除此之外还有一个偏置项w0。每个输入和对应的权重相乘然后进行累加,再通过一个阶跃函数,最简神经网络就是这么简单。这么简单的模型有什么用?其实它可用于线性分类。

假如现在有两类事物,分别用蓝色和黄色表示。我们提取了两个判断因子x1和x2,现在准备使用简单的神经网络函数来决定某个点属于蓝色还是黄色。先计算z = ax1+bx2+c,然后再将z值通过Sigmoid激活函数,Sigmoid函数如图,其值被压缩到0-1之间,0.5作为蓝黄色的分界线。

现在的问题是a、b、c参数该怎么确定才能正确地将蓝色和黄色分开呢?我们先随便猜三个值,比如a=0.20,b=-0.3,c=0.7,则此时的分类效果如下。

继续猜a=-0.20,b=-0.7,c=-0.5,这会运气好,效果看起来挺不错的,都正确分类了。可以肯定的是我们可以无限地猜测下去,而且会找到更加完美的分割线。但是哪条分割线是最好的,而且我们应该如何来寻找这些分割线呢?目前为止我们采取的是猜的策略,也许一猜就中,也许永远都猜不中。

更强大的神经网络

简单的感知机属于线性模型,而通过嵌套多个神经网络层和增加神经元就可以解决很多复杂的问题。

整个神经网络模型包含了三要素:线性变换、非线性变换和线性决策。线性与非线性变换实际上就是坐标变换,将信息聚合到其他空间中。从线性到非线性属于特征变换,将某种特征转成另外一种特征。而多层神经网络就是做表征学习。

从数学上看,神经网络的嵌套就是多个函数嵌套,通过复杂的函数嵌套关系来描述特征关系。

同样是对两类事物进行分类,但这次的任务比较复杂,可以看到黄色和蓝色并不能通过简单的函数进行分割,这时最简单的神经网络已经无能为力了,此时就需要嵌套多个神经网络层并且增加神经元来解决了。

现在我们先对原来中间的网络层增加两个神经元,并再增加一层网络,一共拥有两个隐含层。

最终这种多层的神经网络确实能够完成对这种比较复杂的两类事物的分类。

训练神经网络

我们不可能靠猜测靠运气吃饭,神经网络的参数也一样,还是要踏踏实实地按照科学的方针来训练神经网络。实际上我们常常用误差逆传播算法来训练神经网络,它使用的是梯度下降法,通过反向传播不断调整神经网络中各个权重从而使输出层的误差平方和最小。

神经网络的输出层我们会获取到了一个最终的输出,而这个输出与目标值可能存在误差,可以使用误差平方和作为评判标准,这样我们就可以判断我们找到的函数的好坏。

而且,误差是会反向传播的,每个神经元都会有对应的误差。具体处理时通过梯度下降法便可以更新每一个神经元的权重,这样就能解决了神经网络中连接的参数值了,即能确认所有函数的参数。

大概流程为:

  • 计算从输入到输出的前馈信号。
  • 根据预测值和目标值计算输出误差E。
  • 通过前一层中的权重和相关激活函数的梯度对它们进行加权反向传播误差信号。
  • 基于反向传播误差信号和输入的前馈信号计算参数的梯度

  • 使用计算好的梯度来更新参数,公式为

AI神经网络如何辨别事物相关推荐

  1. SNPE安装+Qualcomm高通AI神经网络处理SDK部署流程

    Qualcomm高通AI神经网络处理SDK部署流程 系统要求 我们建议在专用机器上执行以下操作,以更好地了解 SDK 依赖关系: 安装 Ubuntu 18.04 (推荐),例如在虚拟机上. 安装pye ...

  2. ai神经网络滤镜安装包,ps神经网络滤镜安装包

    如何解决ps2021 新版 AI神经滤镜不能用? 网上买正版,更新下就好了,盗版的都会有各种这样的问题.ps2021神经AI滤镜是需简要上传云端,由Adobe官方服务器人工智能运算的. Ps2021版 ...

  3. ps神经网络滤镜用不了,ai神经网络滤镜安装包

    如何解决ps2021 新版 AI神经滤镜不能用? 网上买正版,更新下就好了,盗版的都会有各种这样的问题.ps2021神经AI滤镜是需简要上传云端,由Adobe官方服务器人工智能运算的. Ps2021版 ...

  4. 《自然》:修复AI神经网络的缺陷

    来源:王宏琳科学网博客 我在上一篇<海外观察>博客中,介绍了纽约大学马库斯教授和戴维斯教授的新书<重启 AI:构建我们可以信任的人工智能>和图灵奖得主朱迪亚•珀尔的著作< ...

  5. My blog in AI ---神经网络,神经元(neural network,nervecell)

    尽管我们有很多经验丰富的软件开发人员,但是利用hard code的方法,要解决一些问题,我们的程序员还是优点捉襟见肘,这些问题包括,识别手写数字照片上的数字:分辨一张彩色照片上是否有一只猫咪:准确理解 ...

  6. ai神经网络滤镜安装包,神经网络ai滤镜用不了

    想学习深度学习需要什么样的基础 很多小伙伴对深度学习的理解都有一些误解,今天就为你一一解答.很多人第一反应是深度学习特别高大上,需要一定基础才能学习,但是关于需要学习深度学习所需要的基础其实存在很多误 ...

  7. 技术新进展!谷歌AI部门宣布发现新技术以加速AI神经网络训练

    https://t.qianzhan.com/caijing/detail/190716-73349ac9.html 谷歌的张量处理器(TPU)和英特尔的Nervana神经网络处理器等人工智能加速器硬 ...

  8. 一个故事看懂AI神经网络工作原理

    我是一个AI神经元 我是一个AI神经元,刚刚来到这个世界上,一切对我来说都特别新奇. 之所以叫这个名字,是因为我的工作有点像人类身体中的神经元. 人体中的神经元可以传递生物信号,给它输入一个信号,它经 ...

  9. AI神经网络-CNN基本结构分析( Conv层、Pooling层、FCN层/softmax层)

    <link href="https://csdnimg.cn/public/favicon.ico" rel="SHORTCUT ICON"> &l ...

最新文章

  1. UART接口与COM口的区别
  2. jquery php 异步图片上传实例,php结合jquery异步上传图片(ajaxSubmit)
  3. 无监督和有监督的区别_干货|全面理解无监督学习基础知识
  4. Linux -- 进程或线程独占CPU
  5. java 二进制 归属权限_【Java EE 学习 75 上】【数据采集系统第七天】【二进制运算实现权限管理】【权限分析和设计】...
  6. 数据结构探险——图篇
  7. php 网站上传大小限制吗,配置PHP程序网站上传文件大小的限制!
  8. 用python求期望_Python——EM(期望极大算法)教学(附详细代码与注解)
  9. 微课|中学生可以这样学Python(例5.1):生成不重复的随机数
  10. SpringMVC的Model、Model Map、ModelAndView
  11. Android预定义样式?android:attr/attribute、?attr/attribute和?attribute
  12. java版本的RtpStream
  13. mysql 联合主键的作用
  14. 圣剑传说 玛娜传奇(Legend of Mana)(LOM)AF推荐放置
  15. WEB_BASIC---02 CSS概述、CSS语法、CSS选择器、CSS声明
  16. SpatialTE:从空间转录组数据集分析转座因子表达的工具
  17. 闲鱼数据采集学习研究
  18. 电工基础知识-配电室安全须知
  19. java环境变量classpath的作用_JAVA环境变量中 classpath、path、JAVA_HOME的作用
  20. ACPI 待机/睡眠/休眠有啥区别?

热门文章

  1. numpy permutation排列组合方法
  2. oracle配置oracle Database Configuration Assistant失败是什么原因?
  3. AI Drive 直播 | Objects365物体检测及CrowdHuman人体检测挑战赛线上颁奖
  4. 图灵奖得主Geoffrey Hinton:脱缰的无监督学习,将带来什么
  5. 公路图和地铁图有什么区别?
  6. SQL——以面向集合的思维方式来思考
  7. 音频数据建模全流程代码示例:通过讲话人的声音进行年龄预测
  8. 统计计量 | 统计学中常用的数据分析方法汇总
  9. 数据蒋堂 | “后半”有序的分组
  10. NIPS 2017录用论文先睹为快!论文作者清华专场分享(附PPT下载)