时隔两年,盘点ECCV 2018影响力最大的20篇论文
上周CV君盘点了去年CVPR中引用量最高的 20 篇论文:
时隔一年,盘点CVPR 2019影响力最大的20篇论文
不少朋友催更ECCV 2018的。
同样是计算机视觉领域顶级会议,ECCV 每两年举办一次,今年的ECCV 2020 在八月末举行,本文盘点 ECCV 2018 影响力最大的20篇论文,毕竟两年过去了,足以看出论文的含金量,事实上直到如今这些工作还深刻影响着计算机视觉领域。
本文所指的影响力以谷歌学术上显示的论文的引用量排序,截止时间为2020年8月3日(今天)。
同前文,先说一些有意思的结论:
1. 这些论文均有开源代码,大部分算法有官方开源版本,少部分由他人实现,其中的著名算法如 DeepLabv3+、CBAM、Group normalization、ShuffleNet V2、BiseNet 都有很多开源实现。经过时间检验的算法,当然会有很多人复现。
2. 这20篇论文包含方向:语义分割(3篇)、注意力模型、网络归一化、神经架构搜索(2篇)、轻量级网络结构、图像翻译(GAN,2篇)、超分辨率、人员重识别(Person ReID)、目标检测、图像修复(Inpainting)、无监督学习、弱监督学习、姿态估计、目标跟踪、动作识别、三维重建。
3. DeepLabv3+ 引用数第一除了因为自身精度高长期霸榜、光芒万丈外,近两年语义分割方向太火肯定也是一个很大的因素,ECCV 2018 就有 3 篇语义分割文章入前20。
4. 排名靠前的算法除了引用数第一的 DeepLabv3+ 为特定方向的算法外(引用数 1941,将近是第 2、3、4位论文引用数总和),其他如CBAM注意力模型(引用数 780)、GN网络归一化方法(引用数 685)、神经架构搜索PNASNet(引用数 663)、轻量级网络结构Shufflenet v2(引用数 654)等研究的均为通用的网络设计、训练方法和组件。
5. CornerNet 算法排名第九,作为anchor-free类目标检测算法的代表作,勉强守住了前十。CVPR 2019 引用最高的20篇论文中出现两篇3D目标检测算法,很明显能看出3D目标检测越来越引起学界的兴趣。
6. 大部分论文有工业界的身影,比如谷歌 4 篇,Facebook 3篇,英伟达 2 篇,Adobe、Intel各 1 篇,国内企业界旷视 2 篇、商汤 2 篇、腾讯 2 篇、微软亚研院 1 篇。
大家还发现了哪些有意思的地方,欢迎在文末留言交流。
NO.1 语义分割 DeepLabv3+
Encoder-decoder with atrous separable convolution for semantic image segmentation
作者 | Liang-Chieh Chen, Yukun Zhu, George Papandreou, Florian Schroff, Hartwig Adam
单位 | 谷歌
论文 | https://arxiv.org/abs/1802.02611
解读 | https://zhuanlan.zhihu.com/p/126567709
代码 | https://github.com/tensorflow/models/
tree/master/research/deeplab
引用 | 1941
NO.2 注意力模型 CBAM
CBAM: Convolutional block attention module
通用提升CNN模型性能的卷积块注意力模型
作者 | Sanghyun Woo, Jongchan Park, Joon-Young Lee, In So Kweon
单位 | 韩国科学技术院;Lunit Inc;Adobe Research
论文 | https://arxiv.org/abs/1807.06521
代码 | https://github.com/Jongchan/attention-module
引用 | 780
NO.3 归一化方法 GN
Group normalization
可代替BN的深度学习归一化方法
作者 | Yuxin Wu, Kaiming He
单位 | FAIR
论文 | https://arxiv.org/abs/1803.08494
解读 | 全面解读Group Normalization-(吴育昕-何恺明 )
https://zhuanlan.zhihu.com/p/35005794
代码 | https://github.com/facebookresearch/
Detectron/tree/master/projects/GN
引用 | 685
NO.4 神经架构搜索 PNASNet
提高了NAS 在ImageNet上的精度,大幅减少了训练时间
Progressive neural architecture search
作者 | Chenxi Liu, Barret Zoph, Maxim Neumann, Jonathon Shlens, Wei Hua, Li-Jia Li, Li Fei-Fei, Alan Yuille, Jonathan Huang, Kevin Murphy
单位 | 约翰斯霍普斯金大学;谷歌AI;斯坦福大学
论文 | https://arxiv.org/abs/1712.00559
解读 | PNASNet详解
https://zhuanlan.zhihu.com/p/52798148
代码 | https://github.com/tensorflow/models/tree/
master/research/slim#Pretrained
代码 | https://github.com/chenxi116/PNASNet
TF(TensorFlow)
代码 | https://github.com/chenxi116/PNASNet.
pytorch(PyTorch)
备注 | ECCV 2018 oral
引用 | 663
NO.5 轻量级网络结构 Shufflenet v2
Shufflenet v2: Practical guidelines for efficient cnn architecture design
新型轻量架构ShuffleNet V2:从理论复杂度到实用设计准则
作者 | Ningning Ma, Xiangyu Zhang, Hai-Tao Zheng, Jian Sun
单位 | 旷视;清华
论文 | https://arxiv.org/abs/1807.11164
代码 | https://github.com/megvii-model/ShuffleNet-Series
解读 | https://zhuanlan.zhihu.com/p/40824527
引用 | 654
NO.6 多模态无监督图像到图像翻译 MUNIT
Multimodal unsupervised image-to-image translation
多模态无监督的图像到图像翻译
作者 | Xun Huang, Ming-Yu Liu, Serge Belongie, Jan Kautz
单位 | 康奈尔大学;英伟达
论文 | https://arxiv.org/abs/1804.04732
解读 | https://zhuanlan.zhihu.com/p/97326646
代码 | https://github.com/nvlabs/MUNIT
引用 | 593
NO.7 超分辨率 残差通道注意力网络(RCAN)
Image super-resolution using very deep residual channel attention networks
作者 | Yulun Zhang, Kunpeng Li, Kai Li, Lichen Wang, Bineng Zhong, Yun Fu
单位 | (美国)东北大学;
论文 | https://arxiv.org/abs/1807.02758
代码 | https://github.com/yulunzhang/RCAN
引用 | 563
NO.8 人员重识别 PCB
Beyond part models: Person retrieval with refined part pooling (and a strong convolutional baseline)
作者 | Yifan Sun, Liang Zheng, Yi Yang, Qi Tian, Shengjin Wang
单位 | 清华大学;悉尼科技大学;
德克萨斯大学圣安东尼奥分校(圣安东尼奥)
论文 | https://arxiv.org/abs/1711.09349
代码 | https://github.com/huanghoujing/beyond-part-models
解读 | https://zhuanlan.zhihu.com/p/31947809
引用 | 526
NO.9 目标检测 anchor-free方法
Cornernet: Detecting objects as paired keypoints
作者 | Hei Law, Jia Deng
单位 | 普林斯顿大学
论文 | https://arxiv.org/abs/1808.01244
解读 | ECCV18 Oral | CornerNet目标检测开启预测“边界框”到预测“点对”的新思路
代码 | https://github.com/umich-vl/CornerNet
引用 | 450
NO.10 图像修复 Partial Convolutions
基于部分卷积Pconv的图片修复
Image inpainting for irregular holes using partial convolutions
作者 | Guilin Liu, Fitsum A. Reda, Kevin J. Shih, Ting-Chun Wang, Andrew Tao, Bryan Catanzaro
单位 | 英伟达
论文 | https://arxiv.org/abs/1804.07723
解读 | https://zhuanlan.zhihu.com/p/163165243
代码 | https://github.com/NVIDIA/partialconv
引用 | 412
NO.11 无监督学习 DeepCluster
用聚类方法结合卷积网络,实现无监督端到端图像分类
Deep clustering for unsupervised learning of visual features
作者 | Mathilde Caron, Piotr Bojanowski, Armand Joulin, Matthijs Douze
单位 | FAIR
论文 | https://arxiv.org/abs/1807.05520
代码 | https://github.com/facebookresearch/deepcluster
解读 | https://zhuanlan.zhihu.com/p/41457268
引用 | 373
NO.12 语义分割 ICNet
高分辨率图像实时语义分割算法ICNet
ICNet for real-time semantic segmentation on high-resolution images
作者 | Hengshuang Zhao, Xiaojuan Qi, Xiaoyong Shen, Jianping Shi, Jiaya Jia
单位 | 香港中文大学;腾讯优图;商汤
论文 | https://arxiv.org/abs/1704.08545
代码 | https://github.com/hszhao/ICNet
引用 | 348
NO.13 AutoML Amc
用于移动端设备的模型压缩与加速的AutoML方法
Amc: Automl for model compression and acceleration on mobile devices
作者 | Yihui He, Ji Lin, Zhijian Liu, Hanrui Wang, Li-Jia Li, Song Han
单位 | 麻省理工学院;卡内基梅隆大学;谷歌
论文 | https://arxiv.org/abs/1802.03494
代码 | https://github.com/mit-han-lab/amc
引用 | 344
NO.14 图像翻译 DRIT
基于解耦表示的图像翻译
Diverse image-to-image translation via disentangled representations
作者 | Hsin-Ying Lee, Hung-Yu Tseng, Jia-Bin Huang, Maneesh Kumar Singh, Ming-Hsuan Yang
单位 | 加州大学默塞德分校;弗吉尼亚理工大学;Verisk Analytics;谷歌云
论文 | https://arxiv.org/abs/1808.00948
解读 | https://zhuanlan.zhihu.com/p/70402066
代码 | https://github.com/HsinYingLee/DRIT/
主页 | http://vllab.ucmerced.edu/hylee/DRIT/
备注 | ECCV 2018 oral
引用 | 338
NO.15 弱监督学习
探索弱监督学习预训练模型的基线
Exploring the limits of weakly supervised pretraining
作者 | Dhruv Mahajan, Ross Girshick, Vignesh Ramanathan, Kaiming He, Manohar Paluri, Yixuan Li, Ashwin Bharambe, Laurens van der Maaten
单位 | Facebook
论文 | https://arxiv.org/abs/1805.00932
代码 | https://github.com/facebookresearch/WSL-Images
引用 | 331
NO.16 人体姿态估计与跟踪
Simple baselines for human pose estimation and tracking
作者 | Bin Xiao, Haiping Wu, Yichen Wei
单位 | 微软亚洲研究院;电子科技大学
论文 | https://arxiv.org/abs/1804.06208
代码 | https://github.com/microsoft/human-pose-estimation.pytorch
引用 | 302
NO.17 实时语义分割 Bisenet
Bisenet: Bilateral segmentation network for real-time semantic segmentation
作者 | Changqian Yu, Jingbo Wang, Chao Peng, Changxin Gao, Gang Yu, Nong Sang
单位 | 华中科技大学;北大;旷视
论文 | https://arxiv.org/abs/1808.00897
代码 | https://github.com/CoinCheung/BiSeNet
解读 | https://zhuanlan.zhihu.com/p/41475332
引用 | 266
NO.18 视觉目标跟踪 DaSiamRPN
Distractor-aware siamese networks for visual object tracking
作者 | Zheng Zhu, Qiang Wang, Bo Li, Wei Wu, Junjie Yan, Weiming Hu
单位 | 国科大;中国科学院自动化研究所;商汤
论文 | https://arxiv.org/abs/1808.06048
解读 | https://zhuanlan.zhihu.com/p/42546692
代码 | https://github.com/foolwood/DaSiamRPN
引用 | 263
NO.19 动作识别
视频中时间关系推理用于动作识别
Temporal relational reasoning in videos
作者 | Bolei Zhou, Alex Andonian, Aude Oliva, Antonio Torralba
单位 | MIT CSAIL
论文 | https://arxiv.org/abs/1711.08496
解读 | https://zhuanlan.zhihu.com/p/32534351
代码 | https://github.com/metalbubble/TRN-pytorch
主页 | http://relation.csail.mit.edu/
引用 | 260
NO.20 Pixel2mesh 从单帧RGB图像生成三维网格模型
Pixel2mesh: Generating 3d mesh models from single rgb images
作者 | Nanyang Wang, Yinda Zhang, Zhuwen Li, Yanwei Fu, Wei Liu, Yu-Gang Jiang
单位 | 复旦大学;普林斯顿大学;英特尔;腾讯AI实验室
论文 | https://arxiv.org/abs/1804.01654
解读 | https://zhuanlan.zhihu.com/p/44346869
代码 | https://github.com/nywang16/Pixel2Mesh
引用 | 245
备注如:CV
计算机视觉交流群
交流学习最新CV技术前沿,扫码备注拉入群。
我爱计算机视觉
微信号:aicvml
QQ群:805388940
微博知乎:@我爱计算机视觉
投稿:amos@52cv.net
网站:www.52cv.net
在看,让更多人看到
时隔两年,盘点ECCV 2018影响力最大的20篇论文相关推荐
- 时隔一年,盘点CVPR 2019影响力最大的20篇论文
CVPR 2019 已经过去一年了,本文盘点其中影响力最大的 20 篇论文,这里的影响力以谷歌学术上显示的论文的引用量排序,截止时间为2020年7月22日. 其中的一些结论蛮有意思的: 1. 这 20 ...
- 盘点CVPR 2019影响力最大的20篇论文
CVPR 2019 已经过去一年了,本文盘点其中影响力最大的 20 篇论文,这里的影响力以谷歌学术上显示的论文的引用量排序,截止时间为2020年7月22日. 其中的一些结论蛮有意思的: 1. 这 20 ...
- 图像分割20年,盘点影响力最大的10篇论文
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 导读 图像分割(image segmentation)技术是计算机 ...
- 【CV】图像分割二十年,盘点影响力最大的10篇论文
编辑丨极市平台 极市导读 图像分割(image segmentation)技术是计算机视觉领域的重要的研究方向,近些年,图像分割技术迅猛发展,在多个视觉研究领域都有着广泛的应用.本文盘点了近20年来影 ...
- 图像分割二十年,盘点影响力最大的10篇论文(含论文和源代码)
图像分割(image segmentation)技术是计算机视觉领域的重要的研究方向,近些年,图像分割技术迅猛发展,在多个视觉研究领域都有着广泛的应用.本文盘点了近20年来影响力最大的10 篇论文. ...
- 图像分割二十年,盘点影响力最大的10篇论文
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 导读 图像分割(image segmentation)技术是计算机视觉领域的重要的研究方向,近些年,图 ...
- CVPR 二十年,影响力最大的 10 篇论文
前言 转载于CVPR 二十年,影响力最大的 10 篇论文! 我们将对计算机视觉领域三大顶会之一CVPR在近二十年来中产生的优秀论文进行一个全面的盘点与总结. CVPR是计算机视觉领域三大顶会中唯一一个 ...
- CVPR 2018 最酷的十篇论文
本文为 AI 研习社编译的技术博客,原标题 : The 10 coolest papers from CVPR 2018 作者 | George Seif 翻译 | Vincents ...
- 2018年最具影响力的20篇数据科学研究论文,盘它!
大数据文摘出品 文章来源:opendatascience.com 编译:Ivy.狗小白.云舟 作为一名前半生奉献给学术,现在投身业界的研究者,Daniel Gutierrez习惯在数据科学业内工作的同 ...
最新文章
- 字符扫描剑指Offer读书笔记之第二章2字符替换Strut2教程-java教程
- 全国大学生智能汽车竞赛-讯飞赛道规则解读
- 如何从Java中打印XML?
- 音频处理基本概念及音频重采样
- oracle 小计 排序,使用SQL实现小计,合计以及排序
- nylon尼龙的来历
- mfc listbox删除多行
- 计算机网络-IP数据报计算(IP数据报分片)一个数据报部分长度为3400字节(使用固定首部)。现在经过一个网络传输,该网络的MTU为800字节:
- 平面设计计算机基本配置,2017平面设计使用的电脑配置
- 天锐绿盾加密软件支持什么操作系统?
- win10计算机等应用不能能用,Win10电脑无法安装应用软件的解决办法
- 小米10获取root权限_安卓刷机搞机小能手必备的三款root神器 最后一款你肯定用过...
- 微信小程序跳转美团饿了么指定商家
- ftp文件服务器编码,ftp服务器字符编码
- linux网卡时断时续,网卡不稳定的罪魁祸首
- DPDK ring简单说明
- 华为哪些手机最先升级鸿蒙,华为鸿蒙升级名单确定,11款机型优先升级,荣耀被暂时遗忘!...
- matlab图形黎曼几何,张思容
- 【转】Keil、uVision、RealView、MDK、Keil C51之间的区别比较
- 程序员工作9年月薪从1.5K到24K,网友:不如刚毕业985
热门文章
- 利用制表位快速居中对齐公式,同时公式编号靠右对齐
- 最小生成树(Kruskal算法+Prim算法)简单讲解+最小生成树例题 acm寒假集训日记22/1/8
- 蔡高厅老师 - 高等数学阅读笔记 - 14 定积分 -定积分的换元法 - 广义积分和伽马函数(65、66、67)
- popfd指令_2. PUSH 和 POP 指 令 3
- java执行python路径_如何在Python中获取当前执行文件的路径?
- HTML是万维网核心语言的第几代,Html5相关的知识点总结
- java websocket下载_java-websocket.jar免费版
- gridcontrol选中多行数据进行复制_终于整理全了,数据核对的6钟方法,掌握它们数据核对你就是大神...
- linux 中断和进程 传递,Linux内核之进程上下文和中断上下文的区别
- MySQL性能医生:Orzdba工具安装和使用