点击上方“机器学习与生成对抗网络”,关注"星标"

获取有趣、好玩的前沿干货!

来自 | 知乎  作者 | 魏秀参  文仅分享,侵删

https://www.zhihu.com/question/41037974/answer/150522307

全连接层到底什么用?我来谈三点。

  • 全连接层(fully connected layers,FC)在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。在实际使用中,全连接层可由卷积操作实现:对前层是全连接的全连接层可以转化为卷积核为1x1的卷积;而前层是卷积层的全连接层可以转化为卷积核为hxw的全局卷积,h和w分别为前层卷积结果的高和宽(注1)。

  • 目前由于全连接层参数冗余(仅全连接层参数就可占整个网络参数80%左右),近期一些性能优异的网络模型如ResNet和GoogLeNet等均用全局平均池化(global average pooling,GAP)取代FC来融合学到的深度特征,最后仍用softmax等损失函数作为网络目标函数来指导学习过程。需要指出的是,用GAP替代FC的网络通常有较好的预测性能。具体案例可参见我们在ECCV'16(视频)表象性格分析竞赛中获得冠军的做法:「冠军之道」Apparent Personality Analysis竞赛经验分享 - 知乎专栏 ,project:Deep Bimodal Regression for Apparent Personality Analysis

  • 在FC越来越不被看好的当下,我们近期的研究(In Defense of Fully Connected Layers in Visual Representation Transfer)发现,FC可在模型表示能力迁移过程中充当“防火墙”的作用。具体来讲,假设在ImageNet上预训练得到的模型为 ,则ImageNet可视为源域(迁移学习中的source domain)。微调(fine tuning)是深度学习领域最常用的迁移学习技术。针对微调,若目标域(target domain)中的图像与源域中图像差异巨大(如相比ImageNet,目标域图像不是物体为中心的图像,而是风景照,见下图),不含FC的网络微调后的结果要差于含FC的网络。因此FC可视作模型表示能力的“防火墙”,特别是在源域与目标域差异较大的情况下,FC可保持较大的模型capacity从而保证模型表示能力的迁移。(冗余的参数并不一无是处。)

注1: 有关卷积操作“实现”全连接层,有必要多啰嗦几句。

以VGG-16为例,对224x224x3的输入,最后一层卷积可得输出为7x7x512,如后层是一层含4096个神经元的FC,则可用卷积核为7x7x512x4096的全局卷积来实现这一全连接运算过程,其中该卷积核参数如下:

“filter size = 7, padding = 0, stride = 1, D_in = 512, D_out = 4096”

经过此卷积操作后可得输出为1x1x4096。

如需再次叠加一个2048的FC,则可设定参数为“filter size = 1, padding = 0, stride = 1, D_in = 4096, D_out = 2048”的卷积层操作。

猜您喜欢:
超100篇!CVPR 2020最全GAN论文梳理汇总!
附下载 | 《Python进阶》中文版
附下载 | 经典《Think Python》中文版
附下载 | 《Pytorch模型训练实用教程》
附下载 | 最新2020李沐《动手学深度学习》附下载 | 《可解释的机器学习》中文版附下载 |《TensorFlow 2.0 深度学习算法实战》附下载 | 超100篇!CVPR 2020最全GAN论文梳理汇总!
附下载 |《计算机视觉中的数学方法》分享

魏秀参:如何理解全连接层的作用?相关推荐

  1. 深入理解卷积层,全连接层的作用意义

    有部分内容是转载的知乎的,如有侵权,请告知,删除便是,但由于是总结的,所以不一一列出原作者是who. 再次感谢,也希望给其他小白受益. 首先说明:可以不用全连接层的. 理解1: 卷积取的是局部特征,全 ...

  2. 神经网络学习笔记(一):全连接层的作用是什么?

    以下是我看过最好的全连接层的解释! 原文链接:卷积神经网络(CNN)入门讲解关注专栏 以上图为例,我们仔细看上图全连接层的结构,全连接层中的每一层是由许多神经元组成的(1 × 4096)的平铺结构,上 ...

  3. 深度学习中多层全连接层的作用

    全连接层参数特多(可占整个网络参数80%左右) 那么全连接层对模型影响参数就是三个: 1,全接解层的总层数(长度) 2,单个全连接层的神经元数(宽度) 3,激活函数 首先我们要明白激活函数的作用是: ...

  4. 卷积神经网络中卷积层、池化层、全连接层的作用

    1. 卷积层的作用 卷积层的作用是提取输入图片中的信息,这些信息被称为图像特征,这些特征是由图像中的每个像素通过组合或者独立的方式所体现,比如图片的纹理特征,颜色特征. 比如下面这张图片,蓝色框框住的 ...

  5. 对于全连接层的理解 全连接层的推导

    全连接层的推导 全连接层的每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来.由于其全相连的特性,一般全连接层的参数也是最多的. 全连接层的前向计算 下图中连线最密集的2个地方就是全连 ...

  6. 全连接层的作用_python构建计算图2——全连接层

    (好久不更~)前文中,参照tensorflow的方式实现了简单的自动求导.接下来要在自动求导的基底(模板)上搭建简单的bp神经网络. 计算图 前文曾多次提到计算图,关于什么是计算图,有很多种说法.既然 ...

  7. 【深度学习】全连接层的作用

    原文链接 https://www.zhihu.com/question/41037974/answer/150522307 全连接层(fully connected layers,FC)在整个卷积神经 ...

  8. 全连接层的作用是什么?

    回答一: 概述 全连接层 Fully Connected Layer 一般位于整个卷积神经网络的最后,负责将卷积输出的二维特征图转化成一维的一个向量,由此实现了端到端的学习过程(即:输入一张图像或一段 ...

  9. 全连接层的作用_全连接层实现

    本文以<Tensorflow2.0深度学习算法实战教材>参考,代码部分全程手打. 图1 将图1 堆叠可以得到含有多个隐藏层的全连接层,如图2所示.因为当前层的输入要与前一层的输出相匹配:所 ...

  10. 全连接层的作用是什么?(nn.Linear())

    回答一: 概述 全连接层 Fully Connected Layer 一般位于整个卷积神经网络的最后,负责将卷积输出的二维特征图转化成一维的一个向量,由此实现了端到端的学习过程(即:输入一张图像或一段 ...

最新文章

  1. 自己动手实现20G中文预训练语言模型示例
  2. c mysql备份还原数据库_如何备份和还原MySQL数据库?
  3. Go 语言读写 Excel
  4. #pragma message的作用
  5. 经纬度画轨迹图_HYSPLIT后向轨迹制作
  6. python3华丽gui_Python3.7 - tkinter Gui 03 Options的用法
  7. pythonsqlite视图_SQLite VIEW/视图
  8. 站立会议(11月19日)
  9. 6.494 - Kindergarten Counting Game
  10. AINLP-Archive:AINLP文章存档计划
  11. 深入剖析ORACLE数据库备份与恢复的原理
  12. websocketpp 最简单的客户端 一
  13. Centos 虚拟机克隆后eth0网卡打不开
  14. at.allow与at.deny及cron.allow与cron.deny优先级的比较
  15. 百度地图矢量瓦片在线下载
  16. SAP标准功能导出期间发货数量的操作指导
  17. c语言 随机四则运算,随机四则运算 C语言
  18. Ubuntu上安装BRAT
  19. Codeforces 1342E Placing Rooks(容斥+组合数学)
  20. cdr宏教程_coreldraw

热门文章

  1. 易语言怎么给手机发短信
  2. Java代码实现SM2算法以及注意点总结(踩坑记录)
  3. JLink驱动设备管理器中显示黄色感叹号
  4. 锦锐单片机开发工具_飞思卡尔单片机PE开发工具硬件及软件
  5. 代码规范利器-阿里代码规范插件
  6. python导入鸢尾花数据集_python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析...
  7. 网络贷款系统完整版源码,thinkphp内核开发,安全可靠,定制网贷分销平台系统
  8. IDEA格式化XML中的SQL语句
  9. 自定义APPLEALC驱动APPLEHDA之整理codec
  10. 计算机网络通信设备的运行温度,什么是机房温度、湿度标准?