近年来,神经网络量化被视为一种有效的模型压缩和加速手段,受到深度学习研究人员的广泛关注。近日,机器学习顶会 ICLR 2021 接收论文结果已经正式公布,至少有 12 项工作展示了神经网络量化方向的相关进展。本文将介绍首个应用二值量化的方法设计的高效点云深度学习模型 BiPointNet,这项研究工作由北京航空航天大学刘祥龙教授团队、商汤新加坡研究团队和加州大学圣迭戈分校共同完成。

随着点云应用的不断演进,用于点云的深度学习模型需要被部署在各类离线边缘场景,如自动驾驶设备和手持移动设备等,这给模型的推理、存储、传输等环节带来了巨大挑战。如何让点云模型在边缘设备上“又轻又快”,是工业界和学术界共同关注的重要问题。

我们的文章旨在解决边缘设备上运行点云应用时的资源限制问题,并提出了第一个点云深度学习二值化模型 BiPointNet。BiPointNet 的准确率表现几乎可以媲美全精度网络,并在边缘设备上带来了14.7 倍的超高加速比和 18.9 倍的存储节省,从模型量化的视角打开了点云模型硬件部署优化的新思路。

Part 1 背景及概述

随着深度神经网络模型能够直接处理原始点云数据,点云学习已经取得了很大的进展。在实际应用场景下,这类网络非常需要实时交互和快速响应,例如自动驾驶和增强现实等。但是,它们的部署环境通常是一些资源受限的边缘设备。尽管研究者们已经提出了诸如 Grid-GCN,RandLA-Net 和 PointVoxel 之类的新颖的算法来加速点云网络的处理,但是它们还是依赖于昂贵的浮点运算。模型二值化方法受益于轻量的二值化参数和高效的按位操作,已成为最有前景的模型压缩加速方法之一,但是由于 2D 图像和 3D 点云之间的根本性差异,现有的二值化方法无法被直接迁移到 3D 点云网络中。

在本文中,我们提出了 BiPointNet,将全精度的点云网络转换成高效且准确的二值化模型 (整体框架图见图 1)。我们研究了二值化特征的信息熵和点云聚合函数的表现之间的关系:为了解决聚合后的二值化特征存在同质化的问题,提出了熵最大化聚合函数 (Entropy-Maximizing Aggregation,EMA);提出了逐层尺度恢复 (Layer-wise Scale Recovery,LSR) 以有效地恢复输出的尺度,并使得尺度敏感的结构可以正常运作。

图 1: BiPointNet 的整体框架图

我们的 BiPointNet 首次实现利用二值化点云网络进行深度学习,并极大地超越了现有的基于 2D 视觉的二值化算法。BiPointNet 的性能表现甚至可以媲美全精度的网络 (准确率相差在 1-2% 以内),它可以被轻易地扩展到其他主流的点云特征提取器上,比如 PointNet++, PointCNN, DGCNN, 和PointConv。BiPointNet 在多种任务上(例如分类、零件分割、语义分割)相较于基线算法都可以取得明显的性能提升。此外,我们在真实设备上对 BiPointNet 进行了实际测试,实现了 14.7 倍的加速和 18.9 倍存储节省。

Part 2 方法

点云非结构化(unstructured)的特征导致多层感知机是网络中最常见的结构,而二值化模型包含的是二值化的多层感知机,能够对轻量级的二值化权重和激活执行高效的位运算操作 (XNOR 和 Bitcount) :

2.2 熵最大化聚合函数

我们的研究表明,由于严重的同质化现象,聚合函数是二值化的一个性能瓶颈。

理想情况下,二值化张量 B 应该尽可能多地保留原始张量 Y 所包含的信息。而当最大池化层的输入呈随机分布时,二值化输出的信息熵随着聚合元素数量n趋近于无穷大而趋向于0。由于点的数量通常较大 (如ModelNet40 的分类任务的n为 1024 ),这导致不论输入池化层的特征如何,其输出特征总是高度相似的,如图 2 所示。2D 视觉中聚合函数通常用较小的核(ResNet 和 VGG-Net 中使用  的池化核),问题并不严重。因此,我们需要一类能够使 B 的信息熵最大化的聚合函数,以避免聚合引起的特征同质化问题。

图 2: 聚合引起的特征同质化问题

我们证明,理论上存在一个分布 Y,通过最大化二值张量 B 的信息熵,能够使得 Y 和 B 的互信息最大化,以尽可能地把 Y 中的信息保留在 B 中。基于此我们提出EMA,一类二值化友好的聚合层,它基于全精度神经网络中的聚合函数,并进一步保留了输入经过变换后的熵。EMA 的定义是:

其中  表示聚合函数 (例如最大池化和平均池化),  表示变换单元,可以有多种形式,我们发现最简单的常数偏移已经十分有效。这个偏移将输入进行移位运算以最大化二值化特征 B 的信息熵。BiPointNet 中的变换单元  可以被定义为 .当  表示最大池化时,目标函数的解与  无关,从而规避了在点云应用中聚合元素数量 n 过大造成的特征同质化问题。

2.3 One-Scale-Fits-All: 逐层尺度恢复

在本节,我们阐述并解决了二值化会导致特征尺度失真的问题。

我们发现,当信息熵取到最大值时,输出特征的尺度与特征通道数直接相关,因此造成尺度的不合理放大,即尺度失真。尺度失真使得一些为 3D 深度学习设计的对尺度较为敏感的结构失效(见图 3),还导致前向传播时的激活和后向传播时的梯度趋于饱和。

图 3: 尺度失真

为了恢复输出的尺度和调整能力,我们提出在 BiPointNet 的二值线性层中应用 LSR。我们设计了一个可学习的逐层尺度恢复因子 ,并通过二值线性层和全精度的输出之间的标准差来初始化:

其中,表示标准差。而且在训练过程中是可学习的。具有 LSR 的二值线性层的计算步骤如下:

其中,分别表示 a 和 z 的梯度。通过在 BiPointNet 中应用 LSR,我们缓解了由于二值化导致输出尺度失真的问题。

Part 3 实验

我们的实验表明了 BiPointNet 在点云学习上的强大性能,部分设置下甚至媲美全精度模型。

表 1 中结果表明,同时使用EMA和LSR可以显著缩小二值化模型和全精度模型之间的性能差距;在表 2 中,我们展示了 BiPointNet 优于其他二值化方法;表 3 展示了在几种主流的点云深度学习模型中取得的提升。

表 1: BiPointNet 在 ModelNet40 (分类)、

ShapeNet Parts (零件分割)、S3DIS (语义分割) 上的消融实验

表 2: 基于 PointNet 的二值化方法对比

表 3: 在主流骨干网络上应用我们的方法

为了验证 BiPointNet 在真实世界的边缘设备上的高效性,我们还将其部署在ARM CPU Cortex-A72 和Cortex-A53 的树莓派上。尽管PointNet 已经是现有模型中公认的快速、轻量模型,BiPointNet依然带来了14.7倍的推理加速和18.9倍的存储节省。

图 5: (a) 耗时对比;(b) 存储使用对比;(c) 不同二值化方案速度和准确率的关系散点图

Part 4 总结

我们提出 BiPointNet 作为第一个在点云上实现高效学习的二值化方法。我们为研究二值化对点云学习模型的影响建立理论基础,并提出了 EMA 和 LSR 方法,提升了模型的性能表现。BiPointNet 超过了现有的二值化方法,并且能够轻松地扩展到各种任务和骨干模型上。同时,它在资源受限的真实设备上实现了 14.7 倍的加速和 18.9 倍的存储节省。我们的工作证实了模型二值化的巨大潜力,希望这个工作能够为未来的研究打下坚实的基础。

Part 5 作者介绍

论文共同第一作者秦浩桐,目前在北京航空航天大学攻读博士,主要研究方向为模型量化压缩与加速、硬件友好的深度学习。

主页:https://htqin.github.io/

论文共同第一作者蔡中昂,目前在新加坡商汤任算法研究员、南洋理工大学博士一年级,主要研究方向为点云深度学习、虚拟数字人。

google scholar:

https://scholar.google.com/citations?user=WrDKqIAAAAAJ&hl=en

论文共同第一作者张明远,目前在新加坡商汤任算法研究员,主要研究方向为多模态场景理解、复杂场景生成。

google scholar:

https://scholar.google.com/citations?user=2QLD4fAAAAAJ&hl=en

论文第四作者丁一芙,北京航空航天大学大四学生,目前保送北航软件国家开发环境国家重点实验室直博。

Part 6 团队介绍

北航刘祥龙教授团队近年来围绕模型低比特量化、二值量化、量化训练等方向做出了一系列具有创新性和实用性的研究成果,包括国际首个二值化点云模型BiPointNet、可微分软量化DSQ、量化训练、信息保留二值网络IR-Net等,研究论文发表在ICLR、CVPR、ICCV等国际顶级会议和期刊上。

主页:http://sites.nlsde.buaa.edu.cn/~xlliu/

商汤新加坡研究团队作为商汤算法研究能力出海的前哨站,自2020年成立以来,服务国内外智慧城市、智慧文旅等多个新兴行业。产品研发与前沿研究并重,专注感知、重建与生成,技术方向包括场景理解、3D点云、虚拟数字人等。团队在一年内有多篇论文被 NeurIPS、ICLR、CVPR 等国际顶级会议接收,并与国际顶尖高校和知名教授达成研究合作。

会议论文

https://openreview.net/forum?id=9QLRCVysdlO

项目网址

https://htqin.github.io/Projects/BiPointNet.html

代码地址

https://github.com/htqin/BiPointNet

来源:商汤学术(ID:SenseTime_Academic)

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~ 

北航、商汤、UCSD 提出首个点云二值网络 BiPointNet(ICLR2021)相关推荐

  1. 14.7倍推理加速、18.9倍存储节省!北航、商汤、UCSD提出首个点云二值网络 | ICLR 2021...

    允中 编辑整理 量子位 报道 | 公众号 QbitAI 编者按: 无论是在自动驾驶场景中,还是在手持移动设备上,基于点云的深度学习模型应用越来越广泛. 但这些离线边缘场景自身的限制,给模型的推理.存储 ...

  2. CVPR Oral:我给大家表演一个无中生有|北航商汤耶鲁

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者丨秦浩桐@知乎(已授权) 来源丨量子位 编辑丨极市平台 量化,作 ...

  3. CVPR 2021 Oral | 我给大家表演一个无中生有!北航商汤耶鲁新作:DSG

    来源:量子位 量化,作为神经网络压缩和加速的重要手段,往往要依赖真实数据进行校准. 此前,一些无数据量化方法虽然解决了数据依赖问题,但是却存在数据分布和样本同质化问题,致使量化模型的精度下降. 现在, ...

  4. CVPR2021 | 北航商汤耶鲁口头报告

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:量子位 报道 | 公众号 QbitAI AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源! ...

  5. opencv 图像 抠图 算法_人工智能 | 不用绿幕也能实时抠图,商汤等提出只需单张图像、单个模型的新方法MODNet...

    openEA开源周刊 openEA开源社区的官方运营载体 这里每天给大家呈现有价值的开源资讯,欢迎您的来稿与推荐,点击上方蓝色字,加入我们吧! 摘要:近日,香港城市大学和商汤提出一种新型人像抠图方法 ...

  6. 精度首超ResNet,港科大和CMU提出史上最强二值化网络ReActNet

    编辑 | 陈大鑫 ECCV 2020 将于8月23日开始,作为两年一度的计算机视觉三大会议之一,备受大家关注.今天和大家分享一篇由香港科技大学和卡耐基梅隆大学共同发表在 ECCV 2020 上的工作& ...

  7. 商汤等提出:统一多目标跟踪框架

    https://www.toutiao.com/a6654722067419628046/ 2019-02-06 11:20:22 正文 <Multi-Object Tracking with ...

  8. AAAI 2020论文解读:商汤科技提出新弱监督目标检测框架

    来源 | Object Instance Mining for WeaklySupervised Object Detection 编辑 | Carol 出品 | AI科技大本营(ID:rgznai1 ...

  9. CVPR 2020 | 中科院、商汤联合提出大规模多标签目标检测新算法

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作分享,不代表本公众号立场,侵权联系删除 转载于:学术头条 AI博士笔记系列推荐 周志华<机器学习>手 ...

  10. 北航、商汤提出的网络二值化新算法 IR-Net,到底好使不?

    [CSDN编者按]在CVPR 2020上,商汤研究院链接与编译组和北京航空航天大学刘祥龙老师团队提出了一种旨在优化前后向传播中信息流的实用.高效的网络二值化新算法IR-Net.不同于以往二值神经网络大 ...

最新文章

  1. mysql如何提高其查询速度的方法
  2. 非科班出身获得软开职位
  3. php ajax轮询推送,[PHP]PHP+AJAX实现轮询代码
  4. 2020年后台开发程序员应该学习的8大技术
  5. oracle 一次删除多张表
  6. 从一个数组中找出最接近目标_LeetCode每日一题 | 转变数组后最接近目标值的数组和...
  7. c语言开根函数不用math,c语言开平方函数怎么用 该函数头文件:math.h;
  8. 相似度计算方法(一) 皮尔森相关系数
  9. mysql数据库加载太慢_MySQL数据库导致网站打开速度慢的解决思路
  10. php夜间时间模式,Typecho夜间模式设置
  11. 常用期刊、会议的简称缩写(深度学习图像处理领域)
  12. 虚拟机创建centons
  13. verilog 定点数、浮点数是什么?怎么表示?怎么做运算?
  14. 拼团返利电商系统(拼返系统)v2.6
  15. python标准库:fractions有理数
  16. OpenCV计算均值和方差
  17. 微信聊天记录内的文件如何实现自动同步备份?
  18. python-微信小程序的学习
  19. 梅森公式的形式和应用
  20. 首都师范 博弈论 4 1 1三人博弈的纳什均衡

热门文章

  1. 【NRF51822】DFU过程梳理
  2. ESP-MESH 无线组网,让智能家居通信组网更方便 | ESP32轻松学(Arduino版)
  3. 软件和算法能力对惯导精度的深刻影响
  4. java list 时间排序_Java collections.sort()根据时间排序list
  5. wtg linux双系统,Windows和Linux同时装入移动硬盘,实现可移动专属双系统
  6. 别再费劲去找后台的前端框架了,2021 年就用 Fantastic-admin 吧
  7. vue2 - 基于Export2Excel.js导出Excel案例(js-xlsx插件二次封装使用)
  8. 吃鸡降落伞降落,射线检测,触发销毁降落伞等
  9. c语言程序设计21点扑克牌,C语言程序设计 21点扑克牌游戏.doc
  10. Xbox360自制系统GOD包安装教程