最近CV君在盘点近几年三大CV顶会的论文,继CVPR 2019 、ICCV 2019 、ECCV 2018 Top 20 论文后:

时隔一年,盘点CVPR 2019影响力最大的20篇论文

时隔两年,盘点ECCV 2018影响力最大的20篇论文

论文盘点:ICCV 2019 Top 20,MobileNetV3居首!

本文盘点CVPR 2018 引用数Top 20 的论文,虽然计划是只取前20篇,但实际上是21篇文章,因为最后两篇文章的引用数恰好相同(截止今日,即2020年8月10日)。

特别值得一提的是 CVPR 2018 引用数最高的论文Squeeze-and-excitation networks(SENet),出自国内自动驾驶公司 Momenta,对整个深度学习研究社区影响巨大。

1. 这些论文涵盖的方向:

基础网络结构(SENet、Non-local)、

轻量级网络结构(MobileNetv2、ShuffleNet)、

神经架构搜索(NASNet)、

图像描述、

GAN(图像转化、图像合成编辑)、

感知相似度量、

超分辨率、

少样本学习、

点云3D目标检测(Voxelnet)、

2D目标检测(Cascade R-CNN)、

RGB-D 3D目标检测、

场景理解多任务学习、

CNN研究(深度图像先验)、

光流(PWC-Net)、

图像修复、

对抗学习、

ReID、

人脸识别(CosFace)。

2. 从以上CVPR 2018 热文中可以看出,网络结构设计(人工设计+机器搜索网络架构)的文章很多,SENet、Non-local、MobileNetv2、ShuffleNet、NASNet 这些工作都对后来的研究有重大影响,相比于之前我们盘点的 CVPR 2019 、ICCV 2019 、ECCV 2018, (CV君认为)CVPR 2018 可能是最为精彩的。

3. 目标检测算法 Cascade R-CNN 到今天依然是COCO数据集上精度最高的算法之一,而且在众多CV算法大赛中折冠。

4. 论文引用是有时间累计效应的,时间越长,引用次数越高,相比于在同一年召开的ECCV 2018 ,CVPR 2018 Top 20 的论文引用量远高于前者,CVPR 在计算机视觉研究社区的影响力更大!

   No. 1 SENet

Squeeze-and-excitation networks

作者 | Jie Hu, Li Shen,  Gang Sun

单位 | Momenta;牛津大学

论文 | https://arxiv.org/abs/1709.01507

解读 | https://zhuanlan.zhihu.com/p/32702350

代码 | https://github.com/hujie-frank/SENet

引用次数 | 3651

SENet 对特征通道间的相关性进行建模,把重要的特征进行强化来提升准确率。是2017 ILSVR竞赛的冠军模型,ImageNet Top-5的错误率2.251%,比2016年的第一名还要低25%,精度提升巨大。

   No. 2 Mobilenetv2

Mobilenetv2: Inverted residuals and linear bottlenecks

作者 | Mark Sandler, Andrew Howard, Menglong Zhu, Andrey Zhmoginov, Liang-Chieh Chen

单位 | 谷歌

论文 | https://arxiv.org/abs/1801.04381

引用次数 | 2384

   No. 3 神经架构搜索 NASNet

Learning transferable architectures for scalable image recognition

作者 | Barret Zoph, Vijay Vasudevan, Jonathon Shlens, Quoc V. Le

单位 | Google Brain

论文 | https://arxiv.org/abs/1707.07012

引用次数 | 1716

   No. 4 Shufflenet

Shufflenet: An extremely efficient convolutional neural network for mobile devices

作者 | Xiangyu Zhang, Xinyu Zhou, Mengxiao Lin, Jian Sun

单位 | 旷视

论文 | https://arxiv.org/abs/1707.01083

代码 | https://github.com/megvii-model/ShuffleNet-Series

引用次数 | 1512

   No. 5 Non-local 神经网络

Non-local neural networks

作者 | Xiaolong Wang, Ross Girshick, Abhinav Gupta, Kaiming He

单位 | 卡内基梅隆大学;FAIR

论文 | https://arxiv.org/abs/1711.07971

代码 | https://github.com/facebookresearch/

video-nonlocal-net

引用次数 | 1509

   No. 6 图像描述与VQA

Bottom-up and top-down attention for image captioning and visual question answering

作者 | Peter Anderson, Xiaodong He, Chris Buehler, Damien Teney, Mark Johnson, Stephen Gould, Lei Zhang

单位 | 澳大利亚国立大学;京东;微软;阿德莱德大学;麦考瑞大学

论文 | https://arxiv.org/abs/1707.07998

备注 | CVPR 2018 full oral

引用次数 | 1177

   No. 7 Stargan 

Stargan: Unified generative adversarial networks for multi-domain image-to-image translation

用于多域图像到图像的转化

作者 | Yunjey Choi, Minje Choi, Munyoung Kim, Jung-Woo Ha, Sunghun Kim, Jaegul Choo

单位 | 高丽大学;NAVER Corp;罗格斯大学;香港科技大學

论文 | https://arxiv.org/abs/1711.09020

代码 | https://github.com/yunjey/stargan

备注 | CVPR 2018 Oral

引用次数 | 1040

   No. 8 Pix2PixHD

High-resolution image synthesis and semantic manipulation with conditional gans

条件GAN进行高分辨率图像合成和语义操作

作者 | Ting-Chun Wang, Ming-Yu Liu, Jun-Yan Zhu, Andrew Tao, Jan Kautz, Bryan Catanzaro

单位 | 英伟达;UC伯克利

论文 | https://arxiv.org/abs/1711.11585

代码 | https://github.com/NVIDIA/pix2pixHD

主页 | https://tcwang0509.github.io/pix2pixHD/

引用次数 | 1035

   No. 9 感知相似性度量

The unreasonable effectiveness of deep features as a perceptual metric

作者 | Richard Zhang, Phillip Isola, Alexei A. Efros, Eli Shechtman, Oliver Wang

单位 | UC伯克利;OpenAI;Adobe Research

论文 | https://arxiv.org/abs/1801.03924

代码 | https://github.com/richzhang/

PerceptualSimilarity

引用次数 | 737

   No. 10 RDN 图像超分辨率

Residual dense network for image super-resolution

作者 | Yulun Zhang, Yapeng Tian, Yu Kong, Bineng Zhong, Yun Fu

单位 | (美国)东北大学;罗切斯特大学;

论文 | https://arxiv.org/abs/1802.08797

代码 | https://github.com/yulunzhang/RDN

备注 | CVPR 2018 spotlight

引用次数 | 705

   No. 11少样本学习

Learning to compare: Relation network for few-shot learning

作者 | Flood Sung, Yongxin Yang, Li Zhang, Tao Xiang, Philip H.S. Torr, Timothy M. Hospedales

单位 | 伦敦玛丽女王大学;牛津大学;爱丁堡大学

论文 | https://arxiv.org/abs/1711.06025

代码 | https://github.com/floodsung/

LearningToCompare_FSL

引用次数 | 702

   No. 12 Voxelnet 点云3D目标检测

Voxelnet: End-to-end learning for point cloud based 3d object detection

基于点云的3D目标检测的端到端学习

作者 | Yin Zhou, Oncel Tuzel

单位 | Apple Inc

论文 | https://arxiv.org/abs/1711.06396

代码 | https://github.com/reinforcementdriving/

VoxelNet_CVPR_2018_PointCloud(非官方)

解读 | https://zhuanlan.zhihu.com/p/40051716

引用次数 | 664

   No. 13 Cascade r-cnn 目标检测

Cascade r-cnn: Delving into high quality object detection

作者 | Zhaowei Cai, Nuno Vasconcelos

单位 | 加利福尼亚大学圣迭戈分校

论文 | https://arxiv.org/abs/1712.00726

代码 | https://github.com/zhaoweicai/cascade-rcnn

解读 | https://zhuanlan.zhihu.com/p/35882192

https://zhuanlan.zhihu.com/p/36095768

引用次数 | 604

   No. 14 RGB-D 3D目标检测

Frustum pointnets for 3d object detection from RGB-D data

从RGB-D数据中检测3D目标的Frustum点阵网

作者 | Charles R. Qi, Wei Liu, Chenxia Wu, Hao Su, Leonidas J. Guibas

单位 | 斯坦福大学;Nuro, Inc;加利福尼亚大学圣迭戈分校

论文 | https://arxiv.org/abs/1711.08488

代码 | https://github.com/charlesq34/frustum-pointnets

解读 | https://zhuanlan.zhihu.com/p/41634956

引用次数 | 589

   No. 15 多任务学习、场景理解

Multi-task learning using uncertainty to weigh losses for scene geometry and semantics

作者 | Alex Kendall, Yarin Gal, Roberto Cipolla

单位 | 剑桥大学;牛津大学

论文 | https://arxiv.org/abs/1705.07115

代码 | https://github.com/ranandalon/mtl(非官方)

引用次数 | 575

   No. 16 深度图像先验

Deep image prior

作者 | Dmitry Ulyanov, Andrea Vedaldi, Victor Lempitsky

单位 | (俄罗斯)Skolkovo 科学技术研究院;牛津大学

论文 | https://arxiv.org/abs/1711.10925

代码 | https://github.com/DmitryUlyanov/deep-image-prior

主页 | https://dmitryulyanov.github.io/

deep_image_prior

引用次数 | 552

这是一篇神奇的文章,它表明CNN天然理解图像应该是什么样子的。

   No. 17 光流

Pwc-net: Cnns for optical flow using pyramid, warping, and cost volume

作者 | Deqing Sun, Xiaodong Yang, Ming-Yu Liu, Jan Kautz

单位 | 英伟达

论文 | https://arxiv.org/abs/1709.02371

代码 | https://github.com/NVlabs/PWC-Net

解读 | https://www.52cv.net/?p=414

备注 | CVPR 2018 Oral

引用次数 | 527

   No. 18 图像修复

Generative image inpainting with contextual attention

作者 | Jiahui Yu, Zhe Lin, Jimei Yang, Xiaohui Shen, Xin Lu, Thomas S. Huang

单位 | 伊利诺伊大学厄巴纳-香槟分校;Adobe Research

论文 | https://arxiv.org/abs/1801.07892

代码 | https://github.com/JiahuiYu/generative

_inpainting

主页 | http://jiahuiyu.com/deepfill/

引用次数 | 522

   No. 19 对抗学习

Robust Physical-World Attacks on Deep Learning Models

作者 | Kevin Eykholt, Ivan Evtimov, Earlence Fernandes, Bo Li, Amir Rahmati, Chaowei Xiao, Atul Prakash, Tadayoshi Kohno, Dawn Song

单位 | 密歇根大学;华盛顿大学;伯克利;三星美国研究院和石溪大学

论文 | https://arxiv.org/abs/1707.08945

代码 | https://github.com/evtimovi/robust_

physical_perturbations

引用次数 | 511

   No. 20 人员重识别

Harmonious attention network for person re-identification

作者 | Wei Li, Xiatian Zhu, Shaogang Gong

单位 | 伦敦玛丽女王大学;Vision Semantics Ltd

论文 | https://arxiv.org/abs/1802.08122

引用次数 | 485

   No. 20(并列)人脸识别 CosFace

Cosface: Large margin cosine loss for deep face recognition

作者 | Hao Wang, Yitong Wang, Zheng Zhou, Xing Ji, Dihong Gong, Jingchao Zhou, Zhifeng Li, Wei Liu

单位 | 腾讯AI Lab

论文 | https://arxiv.org/abs/1801.09414

引用次数 | 485

END

备注:CV

计算机视觉交流群

计算机视觉等最新资讯,若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

论文盘点:CVPR 2018 Top 20,华人发明的SENet居首!相关推荐

  1. 论文盘点:ICCV 2019 Top 20,MobileNetV3居首!

    ICCV 是计算机视觉领域三大顶会之一,往届都是奇数年开(与此对应ECCV 在偶数年开,CVPR 每年都开),ICCV 2019 于 2019年10月27日-11月2日召开,距今不足一年. 继盘点CV ...

  2. 时隔两年,盘点ECCV 2018影响力最大的20篇论文

    上周CV君盘点了去年CVPR中引用量最高的 20 篇论文: 时隔一年,盘点CVPR 2019影响力最大的20篇论文 不少朋友催更ECCV 2018的. 同样是计算机视觉领域顶级会议,ECCV 每两年举 ...

  3. CVPR 2018 论文解读集锦(9月26日更新)

    本文为极市平台原创收集,转载请附原文链接: https://blog.csdn.net/Extremevision/article/details/82757920 CVPR 2018已经顺利闭幕,目 ...

  4. CVPR 2018 论文解读集锦

    之前我们整理过视觉顶级会议CVPR2017的论文解读文章 和ICCV 2017 论文解读集锦,CVPR 2018已经公布了所有收录论文名单,为了能够让大家更深刻了解CVPR的论文,我们进行了一些CVP ...

  5. CVPR 2018 论文解读 | 基于GAN和CNN的图像盲去噪

    作者丨左育莘 学校丨西安电子科技大学 研究方向丨计算机视觉 图像去噪是low-level视觉问题中的一个经典的话题.其退化模型为 y=x+v,图像去噪的目标就是通过减去噪声 v,从含噪声的图像 y 中 ...

  6. 【榜单】机器学习 深度学习近三年被引最多论文 Top 20,图像识别 GAN等(附下载)

    新智元编译 来源:kdnuggets 翻译:刘小芹 胡祥杰 张易 [新智元导读] 深度学习近年来取得了很多惊人的进展,其中一些重要的研究论文可能会达成让数十亿人使用的技术突破.本文搜集了自2014年来 ...

  7. CVPR 2021最佳论文奖的候选名单,华人占据半壁江山,何恺明、陶大程、沈春华等人上榜义目录标题)

    作者: 清华AMiner团队 CVPR 2021最佳论文奖的候选名单,华人占据半壁江山,何恺明.陶大程.沈春华等人上榜,共32篇论文,可直接下载! CVPR 今年共有7015篇有效投稿,有1663篇被 ...

  8. CVPR 2018 论文解读(部分)

    CVPR 2018还有3个月就开始了,目前已经公布了所有收录论文名单,为了能够让大家更深刻了解CVPR的论文,我们进行了一些CVPR 2018论文解读的整理,后续还会持续更新. 1.CVPR2018| ...

  9. CVPR 2018 | 腾讯AI Lab关注的三大方向与55篇论文

    感谢阅读腾讯 AI Lab 微信号第 32 篇文章,CVPR 2018上涌现出非常多的优秀论文,腾讯 AI Lab 对其中精华文章归类与摘要,根据受关注程度,对生成对抗网络.视频分析与理解和三维视觉三 ...

最新文章

  1. QT MSVC 中文报错
  2. Python-OpenCV-- 台式机外接摄像头EAST文本检测+OCR识别
  3. Spring LDAP
  4. python方向键控制角色_用python和pygame游戏编程入门-控制角色移动
  5. IntelliJ IDEA中Maven项目的默认JDK版本
  6. 老李推荐:第14章8节《MonkeyRunner源码剖析》 HierarchyViewer实现原理-获取控件列表并建立控件树 1...
  7. 在C#中ParameterizedThreadStart和ThreadStart区别
  8. 会场安排问题NYOJ14
  9. OpenCV案例(四): 投射矫正
  10. 计算机网络中enable,第一章 计算机网络结构概述1、 enable# conf
  11. 213. Orchard学习 二 3、001.IOrchardHost 与Autofac
  12. vue 数组中嵌套的对象添加新属性--页面更新
  13. Pycharm 搭建 Django 项目 (非常详细)
  14. .chm文件如何打开
  15. Ubuntu Linux,及Python matplot,安装Times New Roman等字体,让图标签可以用Times New Roman等字体
  16. java学习路线(阿里p6)
  17. Java Swing五子棋项目
  18. 网狐荣耀系列之微星棋牌在运营过程中用户登录不上
  19. MATLAB创建音乐《光年之外》
  20. 【轉】一個在台積電工作3年的工程師寫給學弟學妹們的信

热门文章

  1. 根据两点之间的连线,计算连线到各坐标轴之间的夹角(角度,弧度)
  2. keyvaluepair_KeyValuePair用法(转)
  3. 第46屆ICPC 東亞洲區域賽(澳門)(正式賽)Link-Cut Tree
  4. mysql hash创建_Mysql自适应哈希索引(Adaptive Hash Index)创建的条件
  5. 添加公共引用目录_3分钟解决200页Word生成目录的问题,无需插件,领导看了直夸奖...
  6. java函数参数 省略号_[转] java使用省略号代替多参数.pdf
  7. java 静态变量的使用_java的static静态变量是不是不安全的?应该如何正确的使用他呢...
  8. php alpine 安装vim,nginx-php-fpm-alpine
  9. python编程能有什么用_揭秘python都能做什么?
  10. 财经计算机财务函数,会计财务最常用的15个公式函数