AlphaGo浅析——浅析卷积神经网络

各位朋友中秋吉祥~,小编在此给您请安了。
在上节介绍AlphaGo的有监督学习策略网络Pσ的过程中,涉及到了卷积神经网络的相关知识,今日我们就着月饼来了解一下卷积神经网络的一些知识。

一、卷积神经网络概述

1. 组成:输入层+卷积层+激励层+池化层+全连接层

  • 卷积神经网络在传统神经网络的基础上加入了特征提取功能,把传统神经网络的隐含层拓展成了卷积层,池化层(下采样层/降采样层)和全连接层,其中低隐含层是由卷积层和池化层以及激励层交替组成的,是用于实现特征提取功能的核心模块,高隐含(全连接层)对应传统多层感知器的隐含层和逻辑回归分类器。第一个全连接层的输入是由卷积层和池化层进行特征提取得到的特征图像,最后一层的输出是一个可以采用逻辑回归的分类器。

2. 关键操作:局部感受野+权值共享+降采样

1)局部感受野

  • 对于一张图片来说,由于图片的空间联系是局部的,所以每个神经元并不需要了解整张图片,只需要感受局部特征就可以了,当然在更高层会将感受到不同局部特征的神经元汇聚起来得到全局的信息。局部感受野的好处是减少了参数的数目和连接的数目。

2)权值共享

对于一张图片来说,整张图片都是用一个滤波器去扫的,滤波器里面的数值叫做权重,整张图片的权重都是一样的。这样可以提取出处于图片不同位置的完全相同的特征。

3)降采样

池化层对特征图进行特征压缩,以减少连接的数目。常采用的压缩方法为最大池化和平均池化。
按照2 * 2的滤波器大小,以2为步长分别进行最大池化和平均池化的计算。
下图左为原特征,右为用最大池化进行特征压缩后的结果。

下图左为原特征,右为用平均池化进行压缩的结果

3.卷积过程

如下图所示,蓝色矩阵为大小 5 * 5,通道数(深度)为3的图,进过填充值为1的填充后变成了7 * 7的大小。粉红色的矩阵是滤波器,共有两组滤波器。对于每组滤波器而言,其深度与通道数相对应,换句话说就是:图像的通道数有多少,每组就有多少个滤波器。绿色矩阵表示卷积结果,有多少组滤波器参与卷积计算,就会产生多少个结果。-

以滤波器产生第一个结果为例,过程详述如下:

  1. 输入矩阵中有一个和滤波器大小相同的滑框,将滑框中的元素与滤波器中的元素按照位置一一对应相乘。

对应位置相乘后求和,结果为0。

对应位置相乘后求和,结果为2。
对应位置相乘,结果为0

  1. 由于填充量为1,故偏移量为1;
  2. 我们将上面计算的三个结果相加,加上偏移量:0+0+2+1=3。所以结果矩阵对应的第一个位置的结果为3.
  • 根据计算过程,我们可以更加清晰地看出,有几组滤波器参与卷积运算,结果集的深度就是多少,与输入图像的通道数无关。结果集中的结果,是对应位置通道特征的累加和。

二、再度理解监督学习策略网络Pσ

  • 下图为策略学习网络结构,前提条件是输入一个19 * 19 * 48的图像数组,48为通道数。先填充至23 * 23的大小,在第一层用192个 5 * 5 步长为1的卷积核进行卷积操作,经过一个非线性层,又使用192个大小为3 * 3,步长为1的卷积核进行卷积操作,再经过一个非线性层,最后用1个大小为1 * 1,步长为1的卷积核进行卷积操作,最后用Softmax函数进行分类并输出每个位置的下子概率。

    经过对卷积神经网络的学习,小编重新履了一下图示过程:
  1. 对于卷积层的滤波器来说,输入图像的通道数有多少,滤波器的深度就要是多少,所以 5 * 5 * 48 * 192 中的 5 * 5 指滤波器的大小,48 指滤波器的深度(每组滤波器的数目),192 指共有192组滤波器。
  2. 卷积后的结果 19 * 19 * 192 表示的是有 192 个19 * 19 大小的结果矩阵。【再次强调结果矩阵的个数与输入图像的通道数和滤波器的深度无关,结果矩阵是输入图像的各个通道在经过滤波器特征提取后 结果的累加和】。
  3. 对于第 2-12 层隐含层来说,输入的图像数组变成了 19 * 19 * 192 ,192 在此可以理解为通道数,所以对应的滤波器深度变成了192个,由于把图像填充成了 21 * 21 ,所以使用 192组 大小为 3 * 3 ,深度为 192 的滤波器对输入图像进行特征的提取。
  4. 卷积后的结果 19 * 19 * 192 各个数字的含义同步骤2一致。
  5. 最后用 1 个大小为 1 * 1,深度为 192 的卷积核对之前提取到的特征进行汇总,卷积的结果 大小为 19 * 19 ,深度为1。
  6. 最后经过Softmax函数进行分类,输出一个 19 * 19 的结果。

写在最后
- 感谢您的阅读! 本文是小编针对AlphaGo中监督学习策略网络卷积过程的一篇学习笔记,如小编的一些理解有误,敬请斧正。
- 由于小编的数学能力有限,故近期会加大学习量,可能会减缓博客更新的频率,敬请谅解。

AlphaGo浅析——浅析卷积神经网络相关推荐

  1. 标题:浅析图卷积神经网络

    今天想和大家分享的是图卷积神经网络.随着人工智能发展,很多人都听说过机器学习.深度学习.卷积神经网络这些概念.但图卷积神经网络,却不多人提起.那什么是图卷积神经网络呢?简单的来说就是其研究的对象是图数 ...

  2. 神经网络模型中有什么样的算子_浅析图卷积神经网络

    今天想和大家分享的是图卷积神经网络. 随着人工智能发展,很多人都听说过机器学习.深度学习.卷积神经网络这些概念. 但图卷积神经网络,却不多人提起. 那什么是图卷积神经网络呢? 简单的来说就是其研究的对 ...

  3. 卷积神经网络及其在图像处理中的应用

    一,前言 卷积神经网络(Constitutional Neural Networks, CNN)是在多层神经网络的基础上发展起来的针对图像分类和识别而特别设计的一种深度学习方法.先回顾一下多层神经网络 ...

  4. 卷积神经网络 图像处理,卷积神经网络特征提取

    如何利用卷积神经网络提取图像特征 卷积神经网络有以下几种应用可供研究: 1.基于卷积网络的形状识别 物体的形状是人的视觉系统分析和识别物体的基础,几何形状是物体的本质特征的表现,并具有平移.缩放和旋转 ...

  5. 【模型解读】“不正经”的卷积神经网络

    文章首发于微信公众号<与有三学AI> [模型解读]"不正经"的卷积神经网络 这是深度学习模型解读第7篇,本篇我们将介绍不规则形状的卷积. 作者&编辑 | 言有三 ...

  6. 卷积神经网络CNN究竟是怎样一步一步工作的?

    转载:https://www.jianshu.com/p/fe428f0b32c1 [透析] 卷积神经网络CNN究竟是怎样一步一步工作的? 视频地址:https://www.youtube.com/e ...

  7. 大话卷积神经网络CNN,小白也能看懂的深度学习算法教程,全程干货建议收藏!...

    来源 | 程序员管小亮 本文创作的主要目的,是对时下最火最流行的深度学习算法的基础知识做一个简介,作者看过许多教程,感觉对小白不是特别友好,尤其是在踩过好多坑之后,于是便有了写这篇文章的想法. 由于文 ...

  8. 跨界 | 土木工程也开始AI化了:用卷积神经网络实现结构损伤视觉识别

    作者 | 长河 本文来源于微信公众号十千牛(shiqianniu) 自从AlphaGo与柯洁的一场鏖战,人工智能.机器学习.数据挖掘.深度学习.深度人工神经网络--类似的关键词充斥着各大科技类新闻媒体 ...

  9. 深度学习笔记之《解析卷积神经网络》附下载地址

    点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 <解析卷积神经网络>是 @魏秀参 博士撰写的深度学习实践手册,主要以卷积神 ...

  10. 再见,卷积神经网络!

    目前,作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉.分类等领域上,都取得了当前最好的效果. 后来,基于深度神经网络和搜索树 ...

最新文章

  1. 你最常用的构建和发布管理工具是什么
  2. mysql中主键外键的作用_数据库主键和外键的作用以及索引的作用,它的优缺点是什么?...
  3. Java 类的热替换---转载
  4. Linux的一些配置文件位置
  5. 如何确定python开发环境已经配置好_搭建 python 开发环境 前面安装选位置我直接回车了现在我想测试查看目录该怎么办...
  6. oracle 如何创建序列squence
  7. 人脉社群系统源码人脉推广裂变源码群发布源码
  8. oracle唯一性索引的用法,sql – Oracle:基于函数的索引选择唯一性
  9. Your potential, our passion
  10. 初三下半年应该怎样合理的学习?
  11. 机器学习笔记-基于逻辑回归的分类预测
  12. BZOJ1143[CTSC2008] 祭祀river
  13. CentOS7.9下实战安装MySQL5.7
  14. 估算项目工作量的方法:定额法
  15. VM虚拟机中的centOS7如何安装linux QQ
  16. 利用计算机网络实现OA的功能,中小企业oa办公系统解决方案怎么做?
  17. 简单使用PHP 的 Silm框架.
  18. oracle11gora1435,oracle导入的问题
  19. 【CS学习笔记】26、杀毒软件
  20. 送你一波运维背锅专用图~

热门文章

  1. 软件工程——软件详细设计
  2. jmeter TCP接口压力测试
  3. tomcat部署,js中文乱码
  4. APP内嵌h5页面如何分享到微信?
  5. mysql 定时备份和远程备份脚本
  6. 如何使用a标签下载文件
  7. R语言实战应用精讲50篇(三十一)-R语言实现决策树(附R语言代码)
  8. GPS经纬度坐标和UTM坐标的相互转换
  9. 下载instagram
  10. Activiti7 25张表含义