By 元戎感知组

今天主要和大家分享的是今年2月底参加的AAAI22的一些见闻以及一些感兴趣的论文杂谈。再次安利一下我们组最新的一篇被AAAI22接收的点云全景分割的oral paper Sparse Cross-scale Attention Network for Efficient LiDAR Panoptic Segmentation没看过的小伙伴可以点击链接到之前的文章里查看哦。

AAAI22会议见闻

作为人工智能的顶会之一,2022年的AAAI又创造了该会议的历史投稿新高,一共收到了9251 篇投稿,其中 9020 篇投稿进入了评审环节,但是最后的接受率则是历届最低,只有15.0%,1349篇论文被接受,真是越来越“卷”了。

由于疫情的原因,这次大会以线上会议的形式在虚拟空间内举行,这也是最近一些AI会议的常用操作了。图里就是这次AAAI的主会场了,入口外是一个虚拟公园,进入后左边的红色建筑、右边的蓝色建筑都是这次的会场的入口电梯。每个会场中除了有赞助商的位置外,还各有6组海报进行轮流展示,以及2个会议室。

 AAAI22的虚拟公园

根据官方的日程表选择你想要看的海报后,进入相应的建筑,来到对应的海报展位,靠近后就会弹出选项,确认后就可以进入到全屏的poster页面,类似一个小型的会议,你可以和海报的主持人进行沟通提问,还是挺方便的。下图是小编在日常“接客”。如果是Oral的话就是在海报两侧的会议室,会有提前录好的视频进行播放,如果作者在还可以进行在线提问。

 海报答疑

会议的情况就基本介绍到这里啦,下面会介绍下在会上四处“晃悠”看到的个人比较感兴趣的工作,主要集中在自动驾驶3D感知相关的工作,大家有兴趣可以一起来看下~

AAAI22 3D目标检测论文盘点

AAAI22接收了不少和3D相关的论文,这里小编根据个人兴趣着重介绍下面3篇,主要是和3D detection相关,能够提升现有网络的性能或是解决一些棘手的感知问题。

AFDetV2: Rethinking the Necessity of the Second Stage for Object Detection from Point Clouds 【1】

AFDetV2 是Real-Time 3D Detection of the Waymo Open Dataset Challenge 2021的第一名。主要的改进点是从second stage得到的启发。

我们为什么需要second stage, 一般来说有两种理由:

  1. 点云的特征可以恢复因voxelization, striding operations或者lack of receptive field而损失的位置信息;
  2. 物体检测框的回归和物体的分类是两个独立的Head,因此分类置信度可能不能对齐回归的精度

作者通过实验,验证了只用一阶段的voxel-wise特征也可以得到足够精确的物体框回归,因此二阶段的主要贡献来源于分类score的提升,使得分类和回归的精度对齐匹配。基于这个观察,作者提出了一个性能可以媲美二阶段网络的一阶段3D检测器,主要提出了:

1. 把之前的卷积替换为self calibrated convolution block

2. 增加一个IoU alignment head,并且和原始的分类score进行简单的融合

3. Keypoint auxiliary supervision:add another heatmap that predicts 4 corners and the center of every object in BEV during training

Behind the Curtain: Learning Occluded Shapes for 3D Object Detection 【2】

由于外部挡物(external occlusion)和自遮挡(self occlussion),点云在不同物体可以采样得到完全不同的点云形态,如下图所示:

这会带来两个问题:

  1. 遮挡使得物体的点云表现形式不同,有可能导致误检;
  2. 会导致shape missing,导致遮挡状态下预测的bbox的质量很低。

如果遮挡问题不存在会是怎样的呢?作者使用shape matching将相似车型的点云补到被遮挡的车上,发现在KITTI上性能可以逼近到100%,因此影响detection的一个主要原因是遮挡问题。

为了解决这个问题,作者提出了BtcDet来学习物体形状先验,并估计点云中部分遮挡的完整物体形状。BtcDet首先识别出受遮挡和信号缺失影响的区域。在这些区域中,模型预测了probability of occupancy,表明一个区域是否包含物体形状。结合这个概率图,BtcDet可以生成高质量的3D proposals。最后,将probability of occupancy集成到一个proposal refinement模块中,生成最终的物体检测框。

遮挡问题是线上一个比较难解决的点,尤其是当远处大车被遮挡后会导致物体框的大小和位置跳变。作者提供了一个解决这个问题的方案,还是挺有启发的。

Joint 3D Object Detection and Tracking Using Spatio-Temporal Representation of Camera Image and LiDAR Point Clouds 【3】

这篇文章关注了感知领域一个发展的方向,即使用图像和lidar的fusion特征、使用时序特征,并且同时进行Detection和Tracking的任务。

本文提出的3D DetecTrack通过对相机和激光雷达融合得到的空间特征进行加权时间聚合来构造时空特征。然后,检测器使用到上一个时间步骤为止所维护的tracklet中的信息重新配置初始检测结果。Tracker基于Detector产生的时空特征,利用图神经网络(GNN)将被检测的目标与之前跟踪的目标关联起来。

最近CVPR的论文也有很多类似的工作,即Joint 3D Object Detection and Tracking,这也是一个新的值得探索的方向

总结

参加会议最重要的是可以和众多研究者一起交流研究方向,并且可以从论文的发表来捕捉研究方向演变的蛛丝马迹。除了上面的一些论文,还有其他很多值得一读的论文,比如SASA【4】,做的是point based 3D detection,这个方向最近的CVPR也有很多工作在做。再比如上面说的Occlusion和Joint 3D Object Detection and Tracking等方向,都是为了很好的结合产业方向的研究领域,期待有新的work出现。文末附上了文中出现的文章以及相关的一些AAAI22的文章,大家感兴趣可以去看下~

【1】Hu, Yihan; Ding, Zhuangzhuang; Ge, Runzhou; Shao, Wenxin; Huang, Li; Li, Kun; Liu, Qiang. "AFDetV2: Rethinking the Necessity of the Second Stage for Object Detection from Point Clouds." AAAI. 2022.

【2】Xu, Qiangeng; Zhong, Yiqi; Neumann, Ulrich. "Behind the Curtain: Learning Occluded Shapes for 3D Object Detection." AAAI. 2022.

【3】Koh, Junho; Kim, Jaekyum; Yoo, Jinhyuk; Kim, Yecheol; Kum, Dongsuk; Choi, Jun Won. "Joint 3D Object Detection and Tracking Using Spatio-Temporal Representation of Camera Image and LiDAR Point Clouds." AAAI. 2022.

【4】Chen, Chen; Chen, Zhe; Zhang, Jing; Tao, Dacheng. "SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object Detection." AAAI. 2022.

【5】Liu, Xianpeng; Xue, Nan; Wu, Tianfu. "Learning Auxiliary Monocular Contexts Helps Monocular 3D Object Detection." AAAI. 2022.

【6】He, Qingdong; Wang, Zhengning; Zeng, Hao; Zeng, Yi; Liu, Yijun. "SVGA-Net: Sparse Voxel-Graph Attention Network for 3D Object Detection from Point Clouds." AAAI. 2022.

【7】Song, Nan; Jiang, Tianyuan; Yao, Jian. "JPV-Net: Joint Point-Voxel Representations for Accurate 3D Object Detection." AAAI. 2022.

【8】Zhao, Na; Lee, Gim Hee. "Static-Dynamic Co-Teaching for Class-Incremental 3D Object Detection." AAAI. 2022.

AAAI22参会见闻与论文杂谈相关推荐

  1. “小论文”杂谈之二:如何选择一篇好文章

    我前段时间写了一篇文章,叫做<"小论文"杂谈>,是有关自己就研究生写小论文的一些心得体会,点击率挺高的.感谢大家的支持!这也可以看出大家对于"搞科研" ...

  2. 自然语言处理顶会 ACL 2018 参会见闻

    关于作者:郑在翔,现为南京大学自然语言处理实验室二年级硕士生,将准备继续攻读自然语言处理方向的博士.当前主要研究方向为神经网络机器翻译. 作者在本文记录了自己在自然语言处理顶会 ACL 2018 的参 ...

  3. LiveVideoStackCon 2018参会见闻

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/83316191 LiveVi ...

  4. MMsegmentation教程1:学习配置文件

    我们整合了模块和继承设计到我们的配置里,这便于做很多实验.如果您想查看配置文件,您可以运行 python tools/print_config.py /PATH/TO/CONFIG 去查看完整的配置文 ...

  5. AAAI22奖项公布,9000投稿选出唯一杰出论文,中科院自动化所获Distinguished论文奖...

    来源:机器之心 第 36 届 AAAI 人工智能会议已于 2 月 22 日在线上召开.目前,大会公布了今年的杰出论文奖(1 篇)和提名奖(2 篇),其中来自巴黎第九大学.Meta AI 等机构的研究者 ...

  6. 答读者问(2):有关研究生论文及实习等问题

    版权声明:本文为博主原创文章,对文章内容有不论什么意见或建议.欢迎与作者单独交流,作者QQ(微信):245924426. https://blog.csdn.net/zhouzxi/article/d ...

  7. AAAI 2022大奖出炉!9000投稿选出唯一杰出论文!中科院自动化所获Distinguished论文奖...

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 转载自:机器之心 第 36 届 AAAI 人工智能会议已于 2 月 22 日在线上召开.目前,大会公布了今年 ...

  8. 2015.7.11 SDN南京技术交流会

    活动介绍 旧时王谢堂前燕,飞入寻常百姓家,金陵自古多骚客,小暑将至,SDNLAB.com将趁着最后的一丝凉意尚未消失之际为大家带来南京首次SDN技术交流活动. 以SDN为代表的网络创新技术在如火如荼的 ...

  9. ICLR 2020将采用远程会议,首次在非洲办会可能就这样泡汤了

    边策 发自 凹非寺  量子位 报道 | 公众号 QbitAI AI顶会首次在非洲举办,没想到结果是:面基取消. 昨晚,ICLR官方在Twitter上正式宣布,考虑到今年很多人难以参会,将增加远程会议, ...

最新文章

  1. 7-5 顺序存储的二叉树的最近的公共祖先问题(25 分)
  2. 学习游戏渲染(Shader)的用处
  3. 封装,多态,类的约束,super()深入了解
  4. zookeeper集群介绍
  5. java 二维数组
  6. 求一个序列中最大的子序列_最大的斐波那契子序列
  7. Python多线程好文
  8. 实验十一 连接数据库实验(V2.0)
  9. 基于android的团购app设计与实现,基于Android的掌上团购App设计与实现
  10. linux nfs文件共享
  11. 易筋SpringBoot 2.1 | 第廿篇:SpringBoot的复杂JPA以及源码解析
  12. 基于163邮件服务器实现邮箱验证
  13. C语言网络编程——基础
  14. IMU中磁力计的椭球拟合标定法
  15. c语言设计 教师信息管理系统 含源码及说明
  16. mcafee mysql audit_mysql添加mcafee 审计插件
  17. 微信公众号支付报错:当前页面的url未注册
  18. 【二十六】redis之事务、事务特性、与pipeline比较,与Lua脚本比较
  19. 全国各省女孩性格+美丽程度比较分析!
  20. 阿里云服务器学生免费领取指南

热门文章

  1. CS 常用LaTex符号
  2. 机器学习 Study Jam 第三季报名启动!组队通关,快乐 x 3!
  3. 程序员李轩的真实荒诞简历
  4. UVM中component之间如何通信
  5. [转贴]Web地图服务:GIS走近你我
  6. java转换时间格式 yyyy-MM-dd转成yyyy年MM月dd日
  7. matlab加速度积分计算速度和位移
  8. JavaScript零基础知识点
  9. Facebook登录-前端网页以及在angular中的使用方法
  10. 点云孔洞定位_孔洞修补研究总结