【杂七杂八的笔记】2019CVPR论文快读
2019年CVPR一共收到创纪录的5165篇有效投稿,比2018年的3309篇多出近2000篇,最终有1294篇论文被接收,最终录取率为25.2%。1294篇录取论文中,有288篇被录用为Oral论文。现在,距离2020年CVPR的截稿还剩整整一个月,在这种紧迫的时间里,2019CVPR的快读就处于比较尴尬的位置。但是无论怎样也用这篇博客预祝伙(大)伴(佬)们Paper都中!都中!全都中!!!
附上2019年CVPR的MAIN CONFERENCE的地址,里面包含着Award/Oral/Poster的论文。此外,顺便给大家安利一个2019年CVPR论文题目和摘要集合的网址,非常优秀。博客中也贴了一些大佬们的论文博客讲解,感谢大佬们,伙伴们冲啊!!!
2019 CVPR Paper Award
每年的Paper Award还是很值得一读的(如果读得懂的话,阿哈哈哈哈),不过有方向相近的还是要认真读一下全文,Award也是在每年CVPR重含金量最高的几篇论文。
Best Paper Award(1篇)
A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction 【Paper】
非视距形状重建的费马路径理论 ,by Shumian Xin, Sotiris Nousias, Kyros Kutulakos, Aswin Sankaranarayanan, Srinivasa G. Narasimhan and Ioannis Gkioulekas,科研机构分别是卡内基梅隆大学、多伦多大学、伦敦大学学院。值得一提的是,辛书冕本科毕业于西安交通大学电气工程专业,目前是卡内基·梅隆大学机器人研究所的在读博士生(给大佬鼓爪)。
【摘要】 我们提出了一个新的理论,即在一个已知的可见场景和一个不在瞬态相机视线范围内的未知物体之间的Fermat path。这些光路要么遵守镜面反射,要么被物体的边界反射,从而编码隐藏物体的形状。
我们证明费马路径对应于瞬态测量中的不连续性。然后,我们推导出一种新的约束,它将这些不连续处的路径长度的空间导数与表面法线相关联。
基于这一理论,我们提出了一种名为Fermat Flow的算法来估计非视距物体的形状。我们的方法首次允许复杂对象的精确形状恢复,范围从隐藏在拐角处以及隐藏在漫射器后面的漫反射到镜面反射。
最后,我们的方法与用于瞬态成像的特定技术无关。因此,我们展示了使用SPAD和超快激光从皮秒级瞬态恢复的毫米级形状,以及使用干涉测量法从飞秒级瞬态微米级重建。我们相信我们的工作是非视距成像技术的重大进步。
Best Student Paper Award(1篇)
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation 【Paper】【CSDN】
视觉语言导航中的强化跨模态匹配和自监督模仿学习,by Xin Wang, Qiuyuan Huang, Asli Celikyilmaz, Jianfeng Gao, Dinghan Shen, Yuan-Fang Wang, William Yang Wang and Lei Zhang.
【摘要】 视觉语言导航(VLN)的任务是导航一个具体的代理,在真实的3D环境中执行自然语言命令。在这篇文章,我们研究如何解决这个任务中三个至关重要的挑战:跨交叉模态基标对准,不适定反馈,泛化问题。首先,我们提出了一个新颖基于强化学习跨模态匹配(RCM)方法,执行跨交叉模态基标对准在局部和全局中,通过强化学习(RL)。另外,一个匹配评价是用提供一个内在奖励来鼓励在指令和轨迹全局匹配,一个推理导航器应用来执行跨交叉模态基标对准在局部视觉场景。在一个VLN基准数据集上进行评估,我们的RCM模型在SPL比先前的方法增强了10%以及实现了最先进的表现。为提高普遍的学习机制,我们将介绍一个自监督模仿学习(SIL)方法,通过模仿它自己过去好的决策,来去探索未知的环境。我们证明SIL能够估计一个较好和高效的策略,极大地最小化在看见和未看见环境之间成功率表现的差距。(从30.7%到11.7%)
Best Paper Honorable Mention(2 篇)
A Style-Based Generator Architecture for Generative Adversarial Networks 【Paper】 【Code】
GAN中基于风格的生成器,by Tero Karras, Samuli Laine and Timo Aila.这篇论文是PCGAN的论文作者今年的新作,支持机构是英伟达公司。GAN自2014年提出以来得到了很广泛的应用,效果惊艳,本片论文中的效果更加真实。
【摘要】 我们从风格前一种得到启示,为对抗生成网络提出了一种替代的生成器结构。在新的架构将导致一个自动学习,无监督分开高水平特征(例如,姿态识别在训练人脸)以及随机方差在生成图像(例如,雀斑,头发),以及它能够直观,特定尺度控制在统一协调下。新的生成器提高先进的在对于传统分配质量衡量指标,导致证明较好的插补属性,也较好的分开最新的因素变量。对量化插补质量和分离,我们提出两个新的,自动方法来应用到任何生成框架。最后,我们介绍一个新的,高种类和高质量人脸数据集。
Learning the Depths of Moving People by Watching Frozen People 【Paper】【CSDN】
通过观察静止的人来学习移动人的深度,by Zhengqi Li, Tali Dekel, Forrester Cole, Richard Tucker, Ce Liu, Bill Freeman and Noah Snavely.
【摘要】 我们提出了一种在单目摄像机和场景中的人都可以自由移动的情况下预测密集深度的方法。用于从单目视频恢复动态非刚性物体的深度的现有方法对物体的运动施加强烈假设并且可能仅恢复稀疏深度。在本文中,我们采用数据驱动的方法,从新的数据来源中学习人物深度先验:成千上万的人们模仿人体模型的互联网视频,即冻结在多样化,自然的姿势,而手持摄像机巡视现场。因为人是静止的,所以可以使用多视图立体重建来生成训练数据。在推理时,我们的方法使用来自场景的静态区域的运动视差线索来指导深度预测。我们通过移动手持摄像机捕获的复杂人物动作的真实世界序列展示了我们的方法,显示了对前沿的单目深度预测方法的改进,并显示了使用我们预测的深度产生的各种3D效果。
PAMI Longuet-Higgins Prize (Retrospective Most Impactful Paper from CVPR 2009)
ImageNet: A large-scale hierarchical image database 【Paper】
by Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, and Li Fei-Fei.
Longuet-Higgins Prize是 IEEE 计算机协会模式分析与机器智能(PAMI)技术委员会在每年的 CVPR 颁发的 “计算机视觉基础贡献奖”,表彰十年前对计算机视觉研究产生了重大影响的 CVPR 论文。2019年的CVPR的计算机视觉基础贡献奖授予了李飞飞团队的ImageNet Database,这篇论文发表于2009年,目前是计算机视觉的通用且极其重要的数据集之一。
2019 CVPR Oral Paper / Poster Paper
2019年的CVPR的Oral/Poster都很精彩,但是术业有专攻,伙伴们可以各取所需。在博客的一开头就给大家推荐了网站,大家可以自己去看,这里只放一些博主简单看过的论文或者稍微有些相关的论文。
Selective Kernel Networks 【Paper】【Code】【CSDN】【CSDN】
Learning a Deep ConvNet for Multi-Label Classification With Partial Labels 【Paper】
Generalising Fine-Grained Sketch-Based Image Retrieval 【Paper】 【CSDN】
Attention-Aware Multi-Stroke Style Transfer 【Paper】
注意-感知多笔画的风格迁移,By Yuan Yao; Jianqiang Ren; Xuansong Xie; Weidong Liu; Yong-Jin Liu; Jun Wang。
Learning Pyramid-Context Encoder Network for High-Quality Image Inpainting 【Paper】【CSDN】
学习对于高质量图像修复的金字塔-内容编码网络,By Yanhong Zeng; Jianlong Fu; Hongyang Chao; Baining Guo。
这篇博客会不定时的更新啦,小伙伴们可以持续关注啦~祝大家Paper都中!!!
【杂七杂八的笔记】2019CVPR论文快读相关推荐
- 【论文快读】人群计数FIDTM
Focal Inverse Distance Transform Maps for Crowd Localization and Counting in Dense Crowd 华中科大,北邮 挺实用 ...
- Infocom 2020 论文快读
URL: https://infocom2020.ieee-infocom.org/accepted-paper-list-main-conference 选读网络流量分类领域的论文. Autonom ...
- 论文快读:DETReg(CVPR2022)
这是以色列特拉维夫大学和Microsoft Research搞的一篇关于自监督预训练检测任务的文章,DETReg: Unsupervised Pretraining with Region Prior ...
- 【多目标跟踪论文阅读笔记——2021年CVPR论文粗读记录】
[阅读心得] 多目标跟踪经典论文--2021CVPR论文粗读记录 前言 一.学习策略类 QDTrack 二.Temporal-Spatial 类 TADAM Alpha-Refine TraDes C ...
- 【论文泛读】 Deep Learning 论文合集
[论文泛读] Deep Learning 论文合集 文章目录 [论文泛读] Deep Learning 论文合集 Batch Normalization: Accelerating Deep Netw ...
- 【论文泛读】 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
[论文泛读] Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift ...
- 【论文速读】城市自动驾驶应用的概率语义地图
点云PCL免费知识星球,点云论文速读. 标题:Probabilistic Semantic Mapping for Urban Autonomous Driving Applications 作者:D ...
- 【论文速读】RandLA-Net大规模点云的高效语义分割
点云PCL免费知识星球,点云论文速读. 文章:RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds 作者:Qi ...
- 读论文七步走!CV老司机万字长文:一篇论文需要读4遍
视学算法报道 编辑:LRS [新智元导读]读论文对于AI新手和工程师来说可能是一件比较难的事.最近一位从业超5年的CV老司机发布了一篇万字长文,讲述了读论文七步法,从找论文到总结,每篇论文由浅 ...
最新文章
- Anaconda环境管理
- RPC-client异步收发核心细节?
- 分支-03. 三天打鱼两天晒网(Switch…case)
- Struts2学习8--文件上传(单个文件上传)
- java成员属性生命周期,Spring注解 - 生命周期、属性赋值、自动装配
- window.onload事件
- RTX5 | 线程标志组01 - 线程同步
- 设计模式之—访问者模式VisitorPattern
- Android 系统(275)---Mtk Webview基本问题
- Python语言入门教程(一)
- JAVA网络编程实战(笔记)
- 了解一下这几款实用的小众软件,相信你会有意想不到的收获
- 前端项目没数据?教你抓取各大网站api
- 重要极限一:x趋近于0,sinx/x的极限
- Zabbix使用SMTP发送邮件报警并且制定报警内容
- Android动画详解之Android 动画属性和实现方法之帧动画(二)
- ListView点击事件失效
- 亚马逊后台操作不容措施旺季~~~~~~
- 软件单元测试操作步骤(java版)
- 518超市播音软件如何放大音量到150的,传统播音软件声音太小(0-100)