2012年?,微软研究院的创始人里克·雷斯特(Rick Rashid)教授在一
次大会做主题演讲时,展示了一套实时语音机器翻译系统。他在系统中输入一
些英文内容,系统自动翻译成中文并且合成他的声音用中文朗读,在场观众无
不惊叹。实际上这套实时语音翻译系统是基于神经网络算法研发的,会前雷斯
特用自己的声音反复训练模型,在神经网络的帮助?,让模型学习他的声音,
最终实现用机器合成他的中文声音,将以往难以想象的事情变成了现实。
谈起神经网络,很多对它不了解的产品经理会认为这是一种很深奥、复杂
的算法。在工作中,有机会?工程师提起这项技术也是各种调参以及网络结构
设计,渐渐变得敬而远之。实际上神经网络是一种模仿人类思考方式的模型,
就像飞机为了减小空气阻力,模仿鸟的形态一样,其借鉴了生物学的结构。如
果将神经网络拆开来看,结构非常简单,它就是一种将简单结构进行组合,从
而解决复杂问题的典型案例之一。
神经网络(Arti?icial Neural Network)算法,是20世纪80 年代以来人
工智能领域兴起的研究热点之一,也是当今应用最广泛的算法。无论是脸书的
人脸识别、微软的翻译还是谷歌的搜索,背后都有神经网络的身影。神经网络
发展到今天已经变成多学科交?的研究领域,各相关学科对神经网络的定?多
样,目前最广泛使用的定?是托伊沃·科霍宁(Teuvo Kohonen)教授于1988
年给出的定?,即神经网络是由具有适应性的简单单元组成的广泛并行互连的
网络,这种结构使得它能够模拟生物神经系统对真实世界物体所做出的交互反
应。
上述定??起来有点拗口,表达的意思?很简单。用通俗的话讲,神经网
络由很多个计算单元组成,每一个计算单元都有强大的计算能力。这些计算单
元之间相互连接形成一个网状的结构,网状结构具有很强的包容性,因此这
种设计使得神经网络具有很强大的学习能力 。
通常我们理解的神经网络包含两种:一种是生物神经网络;一种是人工神
经网络。人工神经网络由生物神经网络发展而来,所以在学习人工神经网络之
前,首先我们要搞清楚生物神经网络是怎么一回事。
一直以来科学家都在研究人脑的构造,希望有朝一日能够模拟人类思考过
程,造出实现“自主”思考的计算机。人类为什么能够思考呢?生物学家经过
不懈的探索终于发现,在人脑中大约有860亿个神经元,这些神经元相互联结
构成了极其复杂的神经系统,这是人类能够思考的物质基础。
神经元细胞主要由树突、轴突和细胞体构成,如图7-1所示。一个神经元
有多个树突,树突用于接收其他神经元传导过来的信号,并将信号传递给细胞
体。细胞体是神经元中的核心模块,用于处理所有的传入信号,它把各个树突
传递过来的信号加总起来,得到一个总刺激信号。轴突是输出信号的单元,它
有很多个轴突?梢,可以给其他神经元的树突传递信号。神经元的突触会和其
他神经元的树突连接在一起,从而形成庞大的生物神经网络。

神经元有两种状态,即激活状态和非激活状态。在生物神经网络中,神经
元与神经元互相连接。当神经元处于激活状态时,就会向相连的神经元发送化
学物质,从而改变这些神经元内的电位。如果某神经元的电位超过了一个“阈
值”,那么它就会被激活,即该神经元“兴奋”起来,向其他神经元发送化学
物质。

7.1.2 神经元模型
1943年,美国心理学家麦卡洛克(McCulloch, W. S.)和数学家皮特斯
(Puts, W.)参考了生物神经元的结构,把神经元视为二值开关,通过不同的
组合方式来实现不同的逻辑运算,并且将这种逻辑神经元称为二值神经元模型
(McCulloch-Pitts Model, MP模型),结构如图7-2所示。

MP模型是一个包含输入、输出与计算功能的模型。可以将输入功能类比为
神经元的树突,而将输出功能类比为神经元的轴突,计算功能则可以类比为细
胞体。神经元接收来自其他神经元传递过来的输入信号,这些输入信号通过带
权重的连接进行传递,神经元接收到的总输入值将与神经元的阈值进行比较,
然后经过“激活函数”(Activation Function)的处理才能够产生神经元的
输出 。
在MP模型中,非线性的激活函数是整个模型的核心。在数学上的定?为,
当函数的自变量大于某个阈值时,则等于1,否则等于0。具体的公式如?:

实际上MP模型的原理非常好理解,有点类似于我们学生时代的考试,把模
型中很多个影响因素看成很多道题目的得分,不同的题目重要程度不同,我们
对每道题的掌握程度也不同,将题目的重要程度与掌握程度相乘,就是我们这
次考试的分数。
通常我们考完试,老师如何评判考得好不好呢?最简单的方法就是设置一
条阈值线,看看得分有没有超过阈值线,如果超过了就是及格了(正结果),
即对应的输出值为1,如果没有超过就是不及格(负结果),对应的输出值
为-1。
很多同学不理解为什么MP模型中也需要使用激活函数,为什么不用总输出
值直接与阈值比较,然后直接判断输出结果?原因很简单,和逻辑回归函数一
样,如果没有激活函数,无论我们如何训练神经网络的参数,得到的模型都是
一个线性模型,在二维空间?是一条线,在三维空间?是一个平面。而线性模
型是有非常大的局限性的,因为在现实世界中线性模型的应用十分有限,如图
7-3所示。

激活函数能够帮助我们通过对加权的输入进行非线性组合产生非线性决策
边界。简单理解就是将线性模型转变成非线性模型,扩大使用场景。
接?来我们用一个例子帮助大家理解MP模型的决策过程。小李今天的工作
比较忙,正在犹豫中午饭是与同事出去吃还是叫外卖。影响他决定的因素主要
有如?三个方面。
(1)工作量:今天的工作是否能在?班前完成?
(2)同伴:有没有同事一起出去吃饭?
(3)餐厅远近:午休时间较短,选择的餐厅距离是否合适?
遇到这样的问题你是否马上想起了决策树算法?今天我们用另外一种思路
来解决这个问题。值得注意的是,在决策树算法中这三个问题存在先后顺序,
但是对于 MP 模型来说,上面三个问题是并列的,三个影响因素就是三个外部
输入,最后小李决定去还是不去是模型的输出。如果三个问题的答案都
是“YES”,则对应的输出值为1,即去外面吃;如果三个问题的答案都
是“NO”,则对应的输出值为0,即点外卖。
以上两种情况是最理想的情况,判断比较简单。但是在生活中最让人纠结
的地方在于,有一部分因素成立,另一部分因素不成立,在这种情况?最后的
输出会是什么呢?比如今天的工作能做完,但是没有人陪小李出去吃饭,餐厅
也比较远。
在我们实际考虑问题时,每个因素对我们的影响都是不同的。某些因素是
决定性因素,有些因素是次要因素。因此可以给这些因素指定权重,表示不同
的重要性。
工作量:6
同伴:2
餐厅远近:2
通过以上权重可以看出来,工作量是决定性因素,同伴和餐厅远近都是次
要因素。如果三个因素的初始赋值都为 1,它们乘以权重的总和就是
6+2+2=10。如果工作量和餐厅远近因素的初始赋值为1,同伴因素为0,则总和
就变为6+0+2=8。
最后,我们还需要指定一个阈值。如果总和大于阈值,模型输出1,否则
输出0。假定阈值为7,那么当总和超过7时表示小李决定出去吃饭,当总和小
于7时表示小李决定叫外卖。
以上就是一个MP模型的直观解释。1943年发布的MP模型,虽然简单小巧,
但已经建立了神经网络大厦的地基。MP模型最大的缺陷在于,权重的值都是预
先设置的,模型没有办法根据数据的情况进行学习,这让当时的研究人员意识
到,MP模型与人类真正的思考方式仍然有很大区别。直到心理学家唐纳德·赫
布(Donald Olding Hebb)经过研究后指出,人脑神经细胞的连接的强度是可
以变化的,于是科学家们开始考虑用调整权值的方法让机器学习,这为后面的
神经网络算法奠定了基础。

人工智能知识全面讲解:最简单的神经元模型相关推荐

  1. 人工智能知识全面讲解:初识生成对抗网络

    13.1.1 猫和老鼠的游戏 在2016年7月,一款国外的照片处理软件火遍了全世界,同时也引爆了国 人的朋友圈.这款产品就是Prisma.Prisma可以按照你提供的图片内容和指定 的风格,生成一副指 ...

  2. 人工智能知识全面讲解:数据预处理

    数据准备有收集数据.探索数据.数据预处理三个步骤.这一章我们重点 讲解如何挖掘数据的有效信息以及如何对数据进行预处理,以便从加工后的数 据中提取特征,为模型学习打?坚实的基础. 在信息化时代,数据逐渐 ...

  3. 人工智能知识全面讲解:线性支持向量机

    经常喝咖啡的朋友知道,咖啡豆的产地不同,冲出来的咖啡口味也不相 同.阿拉比卡的咖啡具有均衡的风味.口感与香气,而罗布斯塔的咖啡带有强 烈的酸味,口感比较浓郁.挑选咖啡豆是一件非常有讲究的事情,如何区分 ...

  4. 人工智能知识全面讲解:回归分析

    回归分析对我们来说并不陌生,早在小学的时候,有一种题目是从数列中 找规律,然后填出?一个数字.例如一个数列为"1.4.7.10.__",请找 出规律填出?一个数字.对于这个简单的数 ...

  5. 人工智能知识全面讲解:生成对抗网络的应用

    13.2.1 GAN的特点 GAN从2015年提出至今,短短4年的时间已经发展成为人工智能学界一个热 门的研究方向,吸引了大批研究人员来研究 GAN.除了学术界的理论研究以 外,许多科技公司已经付诸行 ...

  6. 人工智能知识全面讲解:特征工程

    2.2.1 如何进行特征工程. 用于机器学习的数据源一般有两种:一种是业务部门直接提供的数据,或 者根据需要在网络上爬取的数据.这种数据称为原始数据,通常存在较多的问 题,需要通过数据预处理整理数据并 ...

  7. 人工智能知识全面讲解: 图像识别的准备工作

    11.1 图像识别的准备工作 11.1.1 从电影走进现实 早在1968年,经典的科幻电影<2001太空漫游>描述了这样一个片段:影 片中的赫伍德教授在登陆环形空间站时,需要进行一个&qu ...

  8. 人工智能知识全面讲解:自然语言处理概述

    2.1.1 什么是自然语言处理 2014年,作为全球第一个以培养情商为目标的AI聊天机器人"微软小 冰"诞生,并在同年6月在微博上线.上线后因性格活泼.聊天能力强引起人 们的热烈反 ...

  9. 人工智能知识全面讲解:多层神经网络与误差逆传播算法

    7.3.1 从单层到多层神经网络 明斯基教授曾表示,单层神经网络无法解决异或问题,但是当增加一个计 算层以后,两层神经网络不仅可以解决异或问题,而且具有非常好的非线性分 类效果.只是两层神经网络的计算 ...

  10. 人工智能知识全面讲解:生活中的决策树

    在日常生活中,我们几乎每天都在做选择题.小到午饭选哪家餐厅的外 卖,大到?业以后选择打工还是创业,都是一个有有限答案的选择题.这些看 似简单的选项背后往往隐藏着一连串问题的答案,只有逐个回答,逐层深入 ...

最新文章

  1. 图像特征点—SIFT特征点
  2. 从地理分类的计算机网格,第2章-地理空间象计算机表达(6-9学时).doc
  3. Altium Designer隐藏或显示元件名字
  4. Excel VBA中的等价(Eqv)和蕴含(Imp)
  5. 【模型解读】深度学习网络只能有一个输入吗
  6. Fiddler抓包工具详解(五)(IOS、安卓抓包+fildder插件)
  7. 计算机网络体系结构(OSI七层、TCP/IP四层、五层协议)
  8. [SSCore] 开源dotnet core 版本 SuperSocket
  9. 不同操作系统打开文件浏览器(资源管理器)的方式
  10. ListObject 多条件去重
  11. Eigen 矩阵计算工具
  12. 编程语言“鄙视链” +1?亚马逊力捧 Rust,Go 技术负责人连发 14 条推特抵制“拉踩”
  13. 简单的用堆栈实现的表达式计算
  14. Spring Boot实现 文件上传与下载,包括前端界面实现
  15. C#版TXT文本分割器
  16. c语言rst关系,为什么服务器突然回复RST——小心网络中的安全设备
  17. 设计模式(讲的比较好-思路清晰,非泛泛而谈)
  18. vue项目无法在IE浏览器中显示
  19. 谷歌google自动打开开发调式工具问题DevTools
  20. Xcode 打包到蒲公英

热门文章

  1. 腾讯等公司python工程师面试题曝光!涨知识了
  2. shell实现ftp命令示例
  3. arcgis 经纬度转大地坐标_arcgis下平面坐标与大地坐标的转换
  4. 网络ip功放连接图_ip网络功放
  5. 正睿OI DAY14 (ks=null)
  6. 单片机74LS138扩展中断
  7. 数学分析教程(科大)——3.3笔记+习题
  8. Linux笔记本电源管理指南
  9. 管理定律——管理学中常见的定律集合
  10. pdf转word好用的软件