hi,dear

have seen many Global Pooling?why is the gap ,gmp, gsp? Will talk in detail

GAP,here is Global average pooling,Not mentioned in NeXtVLAD Global average precision

全局平均池化,这是在图像处理中的最后面的层,为了降维用,一般的池化都有它的size,比如2*2或者3*3等,但GAP不需要,直接一个feature map来一个全局的平均值,over,就是这么简单,每个feature map得到一个值,然后接FC,参数会少很多。不然至少需要一层dense来降维,而dense是占参数最多的,这样GAP既减少计算量,也防止了过拟合。具体讲就是一个卷积后的输出为n*H*W*C(这里H,W仅代表feature map的长宽,不是帧的大小),GAP后直接就是n*C,6不6,下面看下具体的实现方法:

只要将ksize设定的大小与HW维度相同即可,strides设置为1,padding用VALID,用tf.nn.avg_pool2d来实现,然后用reduce来降维,reduce_*都行,如果用keras则直接GlobalAvgPool2D即可解决。针对图像分类的东西目前都是2D pooling,不管是max ,std,还是average都是HW的操作,很容易理解,也不再赘述了,

std是标准差,对HW维度求std,max是求最大值,容易理解,不再细说。

但为何取avg比max常见??avg有特殊功能???按常规理解不应该max吗??

因此也有人说avg更多的是平均信息(也就是图像的背景信息),max则是局部信息(纹理信息)

至于std操作为何,静待大佬的回复吧,毕竟小明哥也不是啥都知道。

20200409后记:

大佬骂了我一顿,paper写的清清楚楚你咋不看,我。。我。。。就是想你直接告诉我

无论你怎么说我以后还是这样,你说一次我就记忆深刻了,你虽然也对我印象差了,但总比没有任何印象好。

大佬的做法是将Gsp和gap一起拼接起来然后进入FC,在这里。

找到了作者的另外一篇文字,matlab写的
Dingquan Li, Tingting Jiang, Weisi Lin, and Ming Jiang. 2019. Which Has Better Visual Quality: The Clear Blue Sky or a Blurry Animal

北大的大佬就是厉害。

欲知更多直接查看56~58,先这样吧,没时间了。

另外有相关问题可以加入QQ群讨论,不设微信群

QQ群:868373192

语音图像视频深度-学习群

关于GP Global Pooling相关推荐

  1. 图像中目标的绝对位置信息(2)--Global Pooling, More than Meets the Eye: Position Information is Encoded Channel-

    关于偶数卷积核和padding的副作用可以参考这个博客. 首先,本文是翻译了 ICCV 2021的一篇文章:Global Pooling, More than Meets the Eye: Posit ...

  2. TEE GP(Global Platform)功能认证产品

    TEE之GP(Global Platform)认证汇总 目录 一.功能认证产品介绍 二.CK810MFT V3.8, ERAGON V3, ALIBABA CLOUD LINK TEE V1.2.0 ...

  3. 机器学习、深度学习面试知识点汇总

    作者丨Oldpan 来源丨oldpan博客 编辑丨极市平台 导读 本文总结了一些秋招面试中会遇到的问题和一些重要的知识点,适合面试前突击和巩固基础知识. 前言 最近这段时间正临秋招,这篇文章是老潘在那 ...

  4. 深度盘点:机器学习、深度学习面试知识点3W字汇总

    作者丨Oldpan 来源丨oldpan博客,编辑丨机器学习社区 欢迎关注,专注学术论文.机器学习.人工智能.Python技巧 前言 最近这段时间正临秋招,这篇文章是我在那会找工作过程中整理的一些重要知 ...

  5. 语义分割--Large Kernel Matters--Improve Semantic Segmentation by Global Convolutional Network

    Large Kernel Matters–Improve Semantic Segmentation by Global Convolutional Network https://arxiv.org ...

  6. [SPP-NET]Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

    基于空间金字塔池化的卷积神经网络物体检测 原文地址:http://blog.csdn.net/hjimce/article/details/50187655 作者:hjimce 一.相关理论 本篇博文 ...

  7. 一文弄懂各大池化Pooling操作

    池化Pooling是卷积神经网络中常见的一种操作,Pooling层是模仿人的视觉系统对数据进行降维,其本质是降维.在卷积层之后,通过池化来降低卷积层输出的特征维度,减少网络参数和计算成本的同时,降低过 ...

  8. 【深度学习】池化 (pooling)

    深度学习中,有两种实现非线性的算子.一个是激活函数,另一个就是池化(pooling): 在知乎上面看到一个关于池化的神解释,摘来: 池化=涨水 卷积的目的是为了得到物体的边缘形状可以想象水要了解山立体 ...

  9. 【图像语义分割】Large Kernel Maters--Improved Semantic Segmentation by Global ConvNet

    该篇文章是face++的文章,个人觉得相当严谨 摘要: 目前流行的网络架构往往通过堆积小的卷积核(stack small filters),因为在相同计算量下,stack small filters往 ...

最新文章

  1. 浏览器上实现数据的本地存储・小结
  2. centos php.ini redis,CentOS下安装Redis及Redis的PHP扩展
  3. oracle 中的trunc()函数及加一个月,一天,一小时,一分钟,一秒钟方法
  4. java利用子类求正方形_Java程序设计实验2011
  5. html 网页制作标签,html网页制作标签最全版.doc
  6. 作者:罗威,男,中国国防科技信息中心副研究员。
  7. lua MVC框架 Orbit初探
  8. 5个开发人员不应该错过的最好跨平台PHP编辑器
  9. 最近要使用User Interface Process Application Block for .NET(微软net开发架构)
  10. ubuntu mysql 5.7 出错_ubuntu mysql5.7 启动提示错误:/var/run/mysqld/mysqld.sock
  11. 光盘显示0字节可用_松下PLC编程软件FPWIN Pro7.4.0.0
  12. Opencv+opencv_contrib安装
  13. Java编程思想(六)
  14. GIMP 快速入门(2)
  15. Dockerfile unable to access ‘.git/‘: Failed to connect to gitlab.com
  16. Mac OS X中安装命令行工具Command Line Tools(无Xcode)
  17. Uibot 浏览器窗口最大化
  18. 百度站长工具 加广告 代码分析
  19. 《女医明妃传》里为美人腹黑的代宗,实际更爱江山,还原真实明史
  20. 手把手教你完成微信H5支付

热门文章

  1. 组合体视图的画图步骤_工程制图第二章组合体视图的绘制和阅读图解析.ppt
  2. thymeleaf模板html a标签,Thymeleaf常用语法:模板片断
  3. 人性的弱点-阅读手记
  4. dvbbs sql版
  5. 【JAVA】桌宠开发发现的有趣内容(1) java 图片镜像 反转的方法。
  6. 局域网限速软件_局域网IP限速怎么配置,限速多少比较合适
  7. SQL server怎么查找某个时间段(多个时间段)的第一个值 或 最后一个值(这里举例查找每小时的第一个值)(Convert详细方法)
  8. 【转】Braid - 一个发人深思的游戏
  9. C#版对对碰[强荐]
  10. 项目实战:基于Servlet和JSP的学生成绩管理系统