这项工作由卡内基梅隆大学,香港科技大学合作完成,目的是通过网络自动化搜索,找到在已知网络的权重(weight)和激活值(activation)都为二值化{-1,+1}的情况下,搜索最能充分利用二值化卷机层的表达能力的网络结构。

该工作是第一篇在 depth-wise 的卷积中通过搜索 group conv 来实现网络二值化的算法。实验结果表明,本方法能取得和接近 XNOR-Net 的精度,而所需的 FLOPs 仅约为 XNOR-Net 的 1/5。借助于 Matrix 层面的参数共享机制,整个搜索过程只需要~30 GPU hours。

论文标题:Binarizing MobileNet via Evolution-based Searching

论文来源:CVPR 2020

论文链接:https://arxiv.org/abs/2005.06305

介绍

深度卷积神经网络(CNN)量化是一种常用的网络压缩方法,而网络二值化是极端情况下的量化,即每个 weight 和 activation 仅用 -1 或 +1 表示。 一方面,在这种极端压缩的情况下,网络的表达能力会受到非常大的限制。另一方面,近来越来越多的学者以及工程师更加关心如何压缩哪些原本就经过了紧凑型网络设计的小网络,如 MobileNet。这就给网络量化提出了新的挑战。

为了应对这一挑战,本文从 MobileNet 网络框架出发,根据二值化网络特性,搜索最佳网络结构。在分析二值化网络的表达能力的时候我们发现,当二值化卷机层是 depth-wise 卷积时,输出的 feature map 中的激活值的取值范围将局限于(-3x3,3x3)之间,由此也导致了 binarize MobileNet 难以收敛。而如果把 MobileNet 中的 depth-wise 卷积替换成全卷积,则会导致參数量增加,从而降低二值化网络的高压缩率。

为了取得压缩率与网络精度之间的权衡,我们认为,每一层卷积对应的feature的抽象化程度不同,因此,对于表达能力的要求也不一样。基于这个假设,我们提出用网络自动搜索(NAS)的方法搜索每一层的组卷积的最优group数,作为depth-wise 卷积和全卷积之间的trade-off。

我们的框架基于 one-shot architecture search,包含三步:

第一步:训练一个参数共享网络。

第二步:用遗传算法在参数共享网络中搜索出最优的 每一层组卷积的 group 数目。

第三步:训练搜索得到的最优网络。

特别的,在训练参数共享网络时,我们为组卷积搜索设计了 matrix-level 的参数共享。

如图所示,在一个输入 6 通道输出 6 通道的卷机层中,可以选取的 group 数目为 1,2,3,6。group=1 时为全卷积,训练参数为存储的所有 weights。当 group=6 时为 depth-wise 卷积,训练参数为对角线上的所选 weights。为了方便直观化表示,下图的每一个 cell 代表了一个 3x3 的卷积核。

实验结果

从表中的比较可以看到, 由本文搜索算法得到的网络结构可以取得超过其他 State-of-the-art 二值化方法的精度,并且所需要的计算资源少于之前众多BNN方法。

最后,HKUST Vision and System Design Lab 正在招有硬件经验的同学来当博士后,由 Tim CHENG 老师直接指导。如果你曾在 DAC,ICCAD 或同等硬件会议/期刊上发表过一作论文,欢迎发送简历到 zliubq@connect.ust.hk。

更多阅读

#投 稿 通 道#

 让你的论文被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。

???? 来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志

???? 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site

• 所有文章配图,请单独在附件中发送

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

CVPR 2020 | CMU HKUST提出binary网络自动化搜索,同时实现超高压缩与高精度相关推荐

  1. CVPR 2020 | 港中文提出3D目标检测新框架DSGN

    ©PaperWeekly 原创 · 作者|张承灏 学校|中科院自动化所硕士生 研究方向|双目深度估计 本文介绍的是香港中文大学贾佳亚团队在 CVPR 2020 上提出的 3D 目标检测新框架--深度立 ...

  2. CVPR 2020 | 旷视提出新型人-物交互检测框架,实现当前最佳

    本文转载自旷视研究院 本文提出一种新型人-物交互检测算法,可直接把人-物交互关系检测为一系列的交互点,进一步预测朝向人和物体中心的交互向量:接着,这些交互点可以配对组合人与物体的检测结果,以生成最终的 ...

  3. CVPR 2020 |商汤提出应对尺度变化的目标检测新算法

    在CVPR 2020上,为了更好的解决物体检测中的尺度问题,商汤EIG算法中台团队重新设计了经典的单阶段检测器的FPN[1]以及HEAD结构,通过构造更具等变性的特征金子塔,以提高检测器应对尺度变化的 ...

  4. CVPR 2020 | 北大Futurewei提出 GraphTER:无监督图变换共变表征学习

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :机器之心 计算机视觉与模式 ...

  5. 【CVPR 2020】华为提出基于进化算法和权值共享的神经网络结构搜索,CIFAR-10上仅需单卡半天...

    为了优化进化算法在神经网络结构搜索时候选网络训练过长的问题,参考ENAS和NSGA-III,论文提出连续进化结构搜索方法(continuous evolution architecture searc ...

  6. CVPR 2020 oral 首次提出VPSnet用于分割界新问题-视频全景分割

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 论文题目:Video Panoptic Segmentation 论文下载: http://opena ...

  7. CVPR 2020:华为GhostNet,超越谷歌MobileNet,已开源

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 作者:王云鹤 知乎链接:https://zhuanlan.zhihu.com/p/ ...

  8. CVPR 2020最新热点:物体位姿估计

    ©PaperWeekly 原创 · 作者|文永明 学校|中山大学硕士生 研究方向|物体位姿估计.目标检测 目录 G2L-Net:从全局到局部的 6D 位姿估计网络 PVN3D:3D 关键点投票 6D ...

  9. CVPR 2020 Oral | 无域标签下高清场景时移变换

    ©PaperWeekly 原创 · 作者|武广 学校|合肥工业大学硕士生 研究方向|图像生成 同一个场景在不同时间段存在着一定的变化,这主要取决于光照对图像的成像的影响,如何通过一个时间段的场景图像在 ...

最新文章

  1. java 初始化系统参数_系统中参数的初始化 参数在系统中配置
  2. bzoj3450 Easy(概率期望dp)
  3. 老鼠实验中老鼠的数量变化曲线
  4. Query框架学习第九天:jQuery工具函数介绍与使用
  5. 电商美工中秋节电商淘宝页面设计模板素材,临摹参考框架
  6. 102份深圳炒房材料曝光 网友举报千人炒房大会
  7. BOMTool更新到1.3.0.10
  8. spring boot antd pro 跨域_springboot配置跨域
  9. 顺序表的基本操作代码实现
  10. Photoshop 2019 破解
  11. 维宏控制卡四轴那个好_维宏维鸿四轴真四轴联动雕刻机运动控制卡说明书.doc...
  12. 酷睿i7 7700hq性能怎么样 i77700hq是什么水平
  13. android icon颜色转换工具,Android代码修改图标颜色
  14. 淘宝店铺图片轮播在线制作技巧
  15. 20.时空跳跃者的魔法
  16. 双冠!网易互娱AI Lab包揽NTIRE 2022高动态范围成像(HDR)两项冠军
  17. http协议和https协议对应的端口号
  18. iOS中SDK的简单封装与使用
  19. tensorflow学习 矩阵乘法和元素乘法
  20. Android StatusBar 黑底白字

热门文章

  1. 解决vue: 无法将“vue”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称...
  2. Spring Boot 注解配置文件自动映射到属性和实体类
  3. 易经读书笔记11地天泰
  4. AngularJS2 环境搭建:
  5. linux (ubuntu)安装pycharm
  6. asp.net mvc 权限过滤和单点登录(禁止重复登录)
  7. 使用JS 加入收藏,设为首页.
  8. web服务器虚拟,虚拟web服务器
  9. js循环写入html不覆盖,【JavaScript】使用document.write输出覆盖HTML问题
  10. rtsp 测试地址_TranServer:简单实现浏览器播放RTSP流