近日,国际人工智能顶级会议 AAAI 2023 (Association for the Advancement of Artificial Intelligence)公布了录用结果。本届会议共收到来自全球的 8777 篇论文投稿,其中 1721 篇论文被录用,论文录用率为 19.6%。

AAAI 是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的 A 类国际学术会议。本届会议旷视研究院被收录的论文涵盖 3D 重建、多目标跟踪、视觉语言多模态、3D 检测、图像对齐等方向,下面是入选论文概览:

01

Semi-supervised Deep Large-baseline Homography Estimation with Progressive Equivalence Constraint

基于渐进式等价约束的半监督深度大基线单应性矩阵估计

在大基线(large-baseline)场景中,由于图像间的重合度低以及相对运动大使得单应性矩阵很难直接估计。为此,我们提出一种渐进式的估计策略,将 large-baseline 单应性矩阵转换为多个中间项,将中间项累积相乘就可以重建初始单应性矩阵。我们引入了一种半监督的单应性一致损失,包括用于优化中间项单应性矩阵的有监督项和基于累积重构在不使用光度损失的情况下优化 large-baseline 单应性矩阵的无监督项。同时,我们提出了一个大规模的数据集,涵盖了常规和挑战性场景。

所属领域:图像对齐/配准

关键词:半监督、大基线单应性矩阵、图像对齐

02

One is All: Bridging the Gap Between Neural Radiance Fields Architectures with Progressive Volume Distillation

一即一切:通过渐进式体蒸馏弥合神经辐射场架构间的差距

神经辐射场 NeRF可以高质量地重建三维场景,目前多种方法都在争夺其核心结构,包括MLP(NeRF)、张量(Plenoxels)、低秩张量(tensoRF)和哈希表(INGP)等。这些表示都有一定的适应场景,比如基于 hash 的 INGP 模型小、训练快,但由于分辨率混叠等原因,其不如基于张量的 Plenoxels 更易实现对场景的空间编辑。为了弥补 NeRF 系列架构间差异,本文提出了渐进式体蒸馏(PVD)实现对上述不同架构间的任意转换。通过 PVD 得到一个 NeRF 模型通常要比从头训练更快,且在部分数据集上质量更高。

论文链接:

https://arxiv.org/abs/2211.15977

开源链接:

https://github.com/megvii-research/AAAI2023-PVD

所属领域:3D重建

关键词:神经辐射场、蒸馏、NeRF、INGP、Plenoxels、tensoRF

03

Generalizing Multiple Object Tracking to Unseen Domains by Introducing Natural Language Representation

利用自然语言表征提升多目标跟踪跨域跟踪性能

本文首先指出当前的多目标跟踪任务多在同一类场景下进行评测,即训练集和测试集取自同一场景(比如MOT17,MOT20),现有的 SOTA 跟踪器在不进行 fine-tune 的前提下直接应用在新场景跟踪性能会大幅下降,为此本文首次提出利用自然语言的高层次语义信息解决跨域跟踪问题,首次将视觉语言预训练模型 CLIP 并将其与 query-basedtracker 结合,基于此搭建的新的多目标跟踪模型 LTrack 可在域内和跨域场景上均实现优异的跟踪性能,为今后利用语言信息与视觉信息结合解决跟踪问题提供一个新的思路。

所属领域:多目标跟踪,视觉语言多模态

关键词:多目标跟踪、视觉语言模型、跨域

04

BEVStereo: Enhancing Depth Estimation in Multi-view 3D Object Detection with Temporal Stereo

BEVStereo:利用时序立体提升环视 3D 检测中的深度估计准确度

现有的在 3D 检测中利用立体视觉提升深度估计的方法大多无法解决两个问题:过多的显存开销以及无法解决运动物体。BEVStereo 通过引入动态立体视觉的方法解决了这个问题,并且提出了可以感知物体尺寸的 circle NMS, 能够避免计算 rotated IoU 的同时将 box 尺寸考虑进去。

论文链接:

https://arxiv.org/abs/2209.10248

开源链接:

https://github.com/Megvii-BaseDetection/BEVStereo

所属领域:3D 检测

关键词:动态立体视觉

05

BEVDepth: Acquisition of Reliable Depth for Multi-view 3D Object Detection

BEVDepth:在 3D 目标检测中获取可靠深度

现有的基于 LSS 的 3D 目标检测算法中,其深度预测模块产生的深度预测结果不够可靠,本文通过加入深度监督,引入相机内外参编码以及深度精修模块,使得 LSS 产生的深度预测变得更加可靠。

论文链接:

https://arxiv.org/abs/2206.10092

开源链接:

https://github.com/Megvii-BaseDetection/BEVDepth/

所属领域:3D 检测

关键词:reliable depth

技术信仰,价值务实

旷厂小伙伴们还将带来怎样的技术创新?

让我们一起期待吧!

AAAI 2023| 旷视研究院入选论文亮点解读相关推荐

  1. CVPR 2022 | 旷视研究院入选论文亮点解读

    关注公众号,发现CV技术之美 本文转载自旷视研究院 日前,CVPR 2022 论文接收情况正式出炉(CVPR 2022 接收论文公布!总计2067篇!).此次旷视研究院表现出色,共有 17 篇论文成功 ...

  2. CVPR 2021 速览 | 旷视研究院入选学术成果盘点

    本文转载自旷视研究院. 日前,CVPR 2021论文接收情况正式出炉.此次,旷视研究院共入选论文22篇,其中Oral论文2篇,研究领域涵盖激活函数.神经网络.神经网络架构搜索.光流估计.无监督学习.人 ...

  3. CVPR 2021 速览 | 旷视研究院入选学术成果盘点(上)

    日前,CVPR 2021论文接收情况正式出炉.此次,旷视研究院共入选论文22篇,其中Oral论文2篇,研究领域涵盖激活函数.神经网络.神经网络架构搜索.光流估计.无监督学习.人体姿态估计.目标检测等. ...

  4. ECCV 2022 旷视入选论文亮点解读(上)

    近日,欧洲计算机视觉国际会议 ECCV 2022(European Conference on Computer Vision)发布了论文录用结果.本届 ECCV 2022论文有效投稿数5803篇,其 ...

  5. ICCV2021旷视研究院入选9篇paper介绍(检测+点云+图像配准等)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 近日,两年一度的国际计算机视觉大会 ICCV 2021( IEEE International Con ...

  6. 【CVPR2021】旷视研究院入选学术成果盘点

    转自:旷视研究院 在CVPR 2021中,旷视研究院共入选论文22篇,其中Oral论文2篇,研究领域涵盖激活函数.神经网络.神经网络架构搜索.光流估计.无监督学习.人体姿态估计.目标检测等. 本篇推文 ...

  7. 法向量 点云pca_CVPR 2019 | 旷视研究院Oral论文提出GeoNet:基于测地距离的点云分析深度网络...

    全球计算机视觉三大顶会之一 CVPR 2019 (IEEE Conference on Computer Vision and Pattern Recognition)将于 6 月 16-20 在美国 ...

  8. CVPR 2019 | 旷视研究院Oral论文提出GeoNet:基于测地距离的点云分析深度网络

    全球计算机视觉三大顶会之一 CVPR 2019 (IEEE Conference on Computer Vision and Pattern Recognition)将于 6 月 16-20 在美国 ...

  9. ECCV 2022 旷视入选论文亮点解读(下)

    上篇还没看够的小伙伴们,快到这里来!

最新文章

  1. Nature子刊:Salmon不比对快速宏基因组基因定量
  2. 轻量级高精度分割网络推荐
  3. [转]T4模版引擎之生成数据库实体类
  4. java在dog中定义name变量,组合构造 冯跃峰 java中组合的应用(不相干的类共同完成一个功能)+构造器回顾...
  5. MVC常见的控制器,接口,数据层之间的操作
  6. 并发编程:进程,线程,协程,异步
  7. Office 2010 体验系列之Outlook使用
  8. 吴恩达机器学习作业 1线性回归
  9. openstack rocky 安装_ubuntu 18.04 安装网易云音乐
  10. Java String 探索
  11. linux卸载keystone服务,OpenStack —— 认证服务Keystone(二)
  12. Atitit 提升水平 把代码写的有技术含量 目录 1. 提高可读性(重要) 2 1.1. 异常模式代替返回值 2 1.2. Dsl 2 1.3. 流畅接口方法链 2 1.4. 层次结构抽象 2 1
  13. Linux怎么删掉ftp服务器,Linux怎么删掉ftp服务器
  14. 实验十四:雨滴传感器实验
  15. AlphaGo Zero算法讲解
  16. 【有限元分析】螺栓连接的几种分析方法
  17. ubuntu永久修改mac地址
  18. NEON intrinsics 函数模式介绍
  19. 美IT业25大秘密:Facebook耗时一周建成
  20. 计算机ppt2007考试试题,全国计算机等级考试二级officeppt演示文稿题目

热门文章

  1. 蓝桥算法训练 藏匿的刺客[Java]
  2. Home Design 3D By LiveCad:让人手一个室内设计师
  3. 【python基础语法八】正则表达式
  4. 中国天然货贝的种类及来源简述
  5. 世界这么大,你去了什么地方,遇见了谁。
  6. strip().split()怎么用
  7. 做好小红书推广的三大要点解析_云媒易
  8. 美国与中国思想观念的不同表现【转载】
  9. Python turtle库绘图 简单实战案例
  10. Datawhale SQL教程来了!