3月1日,中国计算机学会(CCF)推荐的A类国际学术会议CVPR 2021论文接收结果公布。中国人民大学高瓴人工智能学院师生有5篇论文被录用。国际计算机视觉与模式识别会议(Conference on Computer Vision and Pattern Recognition,简称CVPR)是计算机视觉会议的世界三大顶会之一(另外两个是ICCV和ECCV),于每年6月举办。2021年CVPR共有7015篇有效投稿,其中进入Decision Making阶段的共有5900篇,最终有1663篇突出重围被接收,录用率约为23.7%。

论文题目:Cyclic Co-Learning of Sounding Object Visual Grounding and Sound Separation

作    者:田亚鹏,胡迪,徐辰良

通讯作者:胡迪

论文概述:我们的日常生活中有许多同步的音频和视频事件。 在事件内部,音频场景与相应的视觉物体相关联; 同时,发声的物体可以帮助分离音频场景中的各个声音。 基于这种观察,本文提出了一种循环协同学习(Cyclic Co-Learning, CCoL)方法,该方法可以在统一的框架中共同学习发声对象的视觉物体对齐和视听声音分离。具体而言,我们可以利用对齐的对象声音关系来改善声音分离的结果;同时,受益于分离声音的判别信息,我们改进了用于发声物体对齐的训练示例采样,从而为这两项任务建立了协同学习循环,并使它们互惠互利。 大量的实验表明,本文提出的框架在这两个任务上均优于最新的方法,并且通过利用所提出的循环协同学习机制,它们可以彼此受益。

论文题目:Unsupervised Multi-Source Domain Adaptation for Person Re-Identification

作    者:白泽辰,王之港,王建,胡迪,丁二锐

通讯作者:胡迪

论文概述:用于行人重识别(re-identification, re-ID)的无监督领域自适应(Unsupervised Domain Adaptation, UDA)方法旨在将re-ID知识从已标注的源数据迁移到未标注的目标数据源。在现有方法中,虽然基于伪标签的策略取得了巨大的成功,但这些方法仅使用来自某一单源域的有限数据进行模型预训练,使得大量丰富的多源标签数据无法得到充分利用。为了更加充分地利用有价值的标注数据,我们将多源概念引入到行人重识别任务中,其在训练期间使用了多个源数据集。但是,由于不同领域间存在的差异,简单组合不同的数据源只会带来有限的性能提升。在本文中,我们尝试从两个角度解决此问题,即领域特定视图和领域融合视图,它们彼此兼容互补。首先,本文提出一种修正特定领域的批处理规范化(RDSBN)模块,以同时减少领域的差异性并提升行人特征的判别性。其次,本文也提出了基于图卷积网络的多域信息融合(MDIF)模块,该模块通过融合不同域的特征以最小化域间距离。本文所提出的方法在很大程度上优于最新基于无监督领域自适应的行人重识别方法,在没有任何后处理技术的情况下甚至可以达到与监督方法相媲美的性能!

论文题目:L2M-GAN: Learning to Manipulate Latent Space Semantics for Facial Attribute Editing

作    者:杨国兴, 费楠益, 丁明宇,刘光镇,卢志武,向滔

通讯作者:卢志武

论文概述:人脸属性编辑需要同时满足两个要求:(1)属性的正确性—目标属性应该正确地出现在被编辑后的人脸图片上;(2)不相关部分的保持性—任何其他的无关信息(比如身份等)在编辑时不应该被修改。对人脸属性编辑来说,同时满足这两个要求仍然是一个较大的挑战。因此,现有的工作通常采用空间注意力机制或隐空间解耦来应对这一挑战。具体而言,前者假设每个属性都有一个明确定义的局部区域;相对于全局属性,它们通常能够更加有效地编辑局部属性。后者把一个固定的预训练好的GAN的隐空间解耦成不同的属性相关部分,但是它们不能和GAN一起被端到端地训练,这通常会导致次优解。为了克服这些局限性,本文提出了一个全新的隐空间解耦GAN模型—L2M-GAN。该模型可以被端到端地学习,并且可以有效地编辑局部属性和全局属性。L2M-GAN主要有两个创新点:(1)GAN的隐空间向量被解耦成属性相关和属性无关的向量,并引入了正交的限制来增强它们的解耦。(2)学习一个属性相关向量的转换器来操纵属性值。值得注意的是,转变后的向量仍然服从相同的正交限制。通过加强原始(或被编辑后)的属性相关的隐向量与属性无关的隐向量正交性,L2M-GAN在属性正确性和无关部分保持性之间取得了较好的平衡。在CelebA-HQ上的大量实验表明,L2M-GAN与最新的GAN相比有显著的改进。我们的工作也为GAN的语义解释提供新思路。

论文题目:Counterfactual VQA: A Cause-Effect Look at Language Bias

作      者:牛玉磊,汤凯华,张含望,卢志武,华先胜,文继荣

论文概述:近期研究发现,视觉问答模型在训练过程中会倾向于探索数据中的语言偏差,并依赖语言偏差进行推理和作答。这一倾向使得视觉问答模型未能充分地从视觉和语言两个模态中学习多模态知识,进而做出错误的回答。本文研究如何将视觉问答任务中的语言偏差进行捕获并去除。本文从因果推理的视角出发,提出了一种全新的基于反事实推断的视觉问答框架。反事实推断框架将语言偏差建模为问题对答案的直接因果效应,并通过从总体因果效应中减去语言的直接效应的方式去除语言偏差。实验证明反事实推断框架能够有效地克服语言偏差的影响,并具有良好的泛化性和鲁棒性。此外,本文从因果推理的角度为部分相关工作提供了理论解释。

论文题目:HR-NAS: Searching Efficient High-Resolution Neural Architectures with Lightweight Transformers

作    者:丁明宇,连晓晨,杨林杰,王鹏,靳潇杰 ,卢志武,罗平

论文概述:高分辨率(HR)表征对于分割,检测和姿态估计等密集预测任务很关键。以往的专注于图像分类的神经架构搜索(NAS)方案往往忽视了学习高分辨率表征。本篇工作提出了通过有效编码多尺度特征并同时保留高分辨率表示来在多种任务上都搜索出高效和准确的神经网络,我们称其为HR-NAS。在HR-NAS中,我们重新设计了NAS的搜索空间和搜索策略。为了更好地编码多尺度信息,我们首先设计了一个其计算复杂度可以根据不同目标函数和计算预算动态改变的轻量级自注意力变换网络(Transformer);为了保留网络的高分辨率表示,HR-NAS采用基于HRNet的多分支结构来编码部分分辨率的特征;最后,我们提出了一个细粒度的搜索策略来训练HR-NAS,以在不同的任务和计算资源下高效遍历搜索空间并寻找最优架构。在较小的资源预算下,HR-NAS在三个密级预测任务和分类任务上都达到了最优的网络精度和复杂度权衡。

a类论文 计算机视觉,高瓴人工智能学院师生5篇论文被CCF A类会议CVPR录用相关推荐

  1. 数说CS|中国人民大学高瓴人工智能学院保研生源大起底!

    1.院校介绍 中国人民大学高瓴人工智能学院由高瓴资本创始人兼CEO.耶鲁大学校董.中国人民大学校友张磊先生捐资支持,是中国人民大学二级学院,于2019年成立.该学院主要招收人工智能专业的学生,对程序设 ...

  2. 【夏令营QA】2021年中国人民大学信息学院 | 高瓴人工智能学院夏令营经验分享帖

    前言 学校:中国人民大学 学院:信息学院 专业:计算机科学与技术 参加夏令营:RUC 信息学院:RUC 高瓴人工智能学院 最终选择:RUC 高瓴人工智能学院 本人是中国人民大学信息学院 2018 级的 ...

  3. CVPR 2022 Oral | 人大高瓴AI学院提出:面向动态视音场景的问答学习机制

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 标    题:CVPR2022 Oral | 人大高瓴AI学院提出面向动态视音场景的问答学习任务 作    ...

  4. ICCV 2019 中国论文数量超美国,商汤57篇论文入选!

    整理 | AI科技大本营编辑部 出品 | AI科技大本营(ID:rgznai100) ICCV 2019 最佳论文 论文标题:SinGAN:从单张图像学习生成模型 <SinGAN: Learni ...

  5. ICCV 2019 | 中国研究者无缘最佳论文奖项,接收论文数量超美国,商汤57篇论文入选...

    整理 | AI科技大本营编辑部 出品 | AI科技大本营(ID:rgznai100) ICCV 2019 最佳论文 论文标题:SinGAN:从单张图像学习生成模型 <SinGAN: Learni ...

  6. 论文的正确打开方式—如何细读一篇论文分享

    前段时间听了一个关于读论文的公开课,课上的老师讲的非常好,听完之后确实发现从以前看论文的没头没脑到现在的有了一些思绪的变化,所以特此整理了一下分享给大家,希望对大家有用. 在我们初次接触论文的时候,经 ...

  7. 微电子学与计算机期刊2019,微电子与通信工程学院研究生两篇论文被人工智能顶级会议AAAI 2019接收...

    近日,微电子与通信工程学院研究生有两篇文章被国际人工智能领域顶级学术会议AAAI 2019(AAAI Conference on Artificial Intelligence 2019)录用.AAA ...

  8. 国际顶会论文计算机,计算机所彭宇新课题组的6篇论文被人工智能领域顶级国际会议IJCAI 2018录用...

    2018年4月17日,据人工智能领域顶级国际会议The 27th International Joint Conference on Artificial Intelligence(IJCAI 201 ...

  9. 计算机ccf a类论文,我院师生3篇论文被CCF-A类会议KDD(2020)录用

    会议介绍: ACM SIGKDD(国际数据挖掘与知识发现大会,简称KDD)是数据挖掘领域的顶级国际学术会议,由美国计算机学会(ACM)数据挖掘及知识发现专委会(SIGKDD)主办,被中国计算机学会(C ...

最新文章

  1. oracle bi publisher 安装,Oracle BI Publisher 企业版安装后的配置(BI Publisher Enterpr
  2. c语言图片合并 代码,帮个忙,合并代码
  3. 怎样把python源程序发给别人_如何把Python源码打包成EXE文件?以及bug
  4. DHL 快递跟踪查询
  5. rsyslog 日志管理服务
  6. Excel文档VBA代码自动删除
  7. source insight 使用技巧
  8. 多功能函数计算器(MATLAB实现)
  9. ARCore之路-环境准备
  10. 5G时代传统室内覆盖方案迎挑战,融合室分系统应运而生
  11. Dockerfile的编写
  12. 计算机盘中文件夹丢失,“文件夹丢失,我的电脑杀完毒后,很多文件夹找不到了”的解决方案...
  13. 2、GIT---时光穿梭机
  14. JS获取今天是本月第几周、本月共几周、本月有多少天、是今年的第几周、是今年的第几天、某周的区间范围
  15. 电脑删除的文件如何找回?
  16. 华为为LG Uplus提供10万个NB-IoT芯片和模块
  17. 教育行业疫情分析研判报告撰写格式与模板详解
  18. Redhat Linux无显示器无键盘无鼠标启动,并提供远程服务
  19. 计算机无法识别相机,教您如果戴尔计算机无法检测到相机怎么办
  20. AOP实现的三种方法 切入点 切入面

热门文章

  1. java长方形周长计算_Java练习 SDUT-3339_计算长方形的周长和面积(类和对象)
  2. GAN Dissection: Visualizing and Understanding Generative Adversarial Networks
  3. 碳化硅(SiC):新一代半导体材料,打开新能源车百亿市场空间
  4. matlab背景换为黑色的,matlab、opencv护眼模式之黑色主题
  5. u盘容量影响计算机运行速度,一个小U盘,竟可以给电脑提速!
  6. 打印机扫描显示服务器错误代码,打印机操作无法完成错误代码0x00000015的解决办法...
  7. 小知识·BitTorrent 简介
  8. 安徽基础教育资源应用平台.html,安徽基础教育资源应用平台登录入口:http://www.ahedu.cn/EduResource/index.php...
  9. html 手机端 应用程序,移动端Web开发
  10. 乔哈里视窗:职场社交有效沟通法则