图像分割(image segmentation)技术是计算机视觉领域的重要的研究方向,近些年,图像分割技术迅猛发展,在多个视觉研究领域都有着广泛的应用。本文盘点了近20年来影响力最大的10 篇论文。 注:这里的影响力以Web of Science上显示的论文的引用量排序,截止时间为2020年9月27日。

TOP10- Mask R-CNN

被引频次:1839
作者:Kaiming He,Georgia Gkioxari,Piotr Dollar,Ross Girshick.
发布信息: 2017,16th IEEE International Conference on Computer Vision (ICCV)
论文:https://arxiv.org/abs/1703.06870
代码:https://github.com/facebookresearch/Detectron

Mask R-CNN作为非常经典的实例分割(Instance segmentation)算法,在图像分割领域可谓“家喻户晓”。Mask R-CNN不仅在实例分割任务中表现优异,还是一个非常灵活的框架,可以通过增加不同的分支完成目标分类、目标检测、语义分割、实例分割、人体姿势识别等多种不同的任务。

TOP9-SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

被引频次:1937
作者: Vijay Badrinarayanan,Alex Kendall,Roberto Cipolla
发布信息:2015,IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE
论文:https://arxiv.org/pdf/1511.00561.pdf
代码:https://github.com/aizawan/segnet

SegNet是用于进行像素级别图像分割的全卷积网络。SegNet与FCN的思路较为相似,区别则在于Encoder中Pooling和Decoder的Upsampling使用的技术。Decoder进行上采样的方式是Segnet的亮点之一,SegNet主要用于场景理解应用,需要在进行inference时考虑内存的占用及分割的准确率。同时,Segnet的训练参数较少,可以用SGD进行end-to-end训练。

TOP8-DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

被引频次:2160
作者: Chen Liang-Chieh,Papandreou George,Kokkinos Iasonas等.
发布信息:2018,IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE
DeepLabv1:https://arxiv.org/pdf/1412.7062v3.pdf
DeepLabv2:https://arxiv.org/pdf/1606.00915.pdf
DeepLabv3:https://arxiv.org/pdf/1706.05587.pdf
DeepLabv3+:https://arxiv.org/pdf/1802.02611.pdf
代码:https://github.com/tensorflow/models/tree/master/research/deeplab

DeepLab系列采用了Dilated/Atrous Convolution的方式扩展感受野,获取更多的上下文信息,避免了DCNN中重复最大池化和下采样带来的分辨率下降问题。2018年,Chen等人发布Deeplabv3+,使用编码器-解码器架构。DeepLabv3+在2012年pascal VOC挑战赛中获得89.0%的mIoU分数。

TOP7-Contour Detection and Hierarchical Image Segmentation

被引频次:2231
作者: Arbelaez Pablo,Maire Michael,Fowlkes Charless等.
发布信息:2011,IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE
论文和代码:https://www2.eecs.berkeley.edu/Research/Projects/CS/vision/grouping/resources.html

Contour Detection and Hierarchical Image Segmentation通过检测轮廓来进行分割,以解决不加交互的图像分割问题,是分割领域中非常重要的一篇文章,后续很多边缘检测算法都利用了该模型。

TOP6-Efficient graph-based image segmentation

被引频次:3302
作者:Felzenszwalb PF,Huttenlocher DP
发布信息:2004,INTERNATIONAL JOURNAL OF COMPUTER VISION
论文和代码:http://cs.brown.edu/people/pfelzens/segment/

Graph-Based Segmentation 是经典的图像分割算法,作者Felzenszwalb也是提出DPM算法的大牛。该算法是基于图的贪心聚类算法,实现简单。目前虽然直接用其做分割的较少,但许多算法都用它作为基石。

TOP5-SLIC Superpixels Compared to State-of-the-Art Superpixel Methods

被引频次:4168
作者: Radhakrishna Achanta,Appu Shaji,Kevin Smith,Aurelien Lucchi,Pascal Fua,Sabine Susstrunk.
发布信息:2012,IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE
论文和代码:https://ivrlwww.epfl.ch/supplementary_material/RK_SLICSuperpixels/index.html

SLIC 算法将K-means 算法用于超像素聚类,是一种思想简单、实现方便的算法,SLIC算法能生成紧凑、近似均匀的超像素,在运算速度,物体轮廓保持、超像素形状方面具有较高的综合评价,比较符合人们期望的分割效果。

TOP4-U-Net: Convolutional Networks for Biomedical Image Segmentation

被引频次:6920
作者: Ronneberger Olaf,Fischer Philipp,Brox Thomas
发布信息:2015,18th International Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI)

论文:https://arxiv.org/pdf/1505.04597.pdf
代码:https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/

U-Net是一种基于深度学习的图像语义分割方法,在医学图像分割领域表现尤为优异。它基于FCNs做出改进,相较于FCN多尺度信息更加丰富,同时适合超大图像分割。作者采用数据增强(data augmentation),通过使用在粗糙的3*3点阵上的随机取代向量来生成平缓的变形,解决了可获得的训练数据很少的问题。并使用加权损失(weighted loss)以解决对于同一类的连接的目标分割。

TOP3-Mean shift: A robust approach toward feature space analysis

被引频次:6996
作者: Comaniciu D,Meer P
发布信息:2002,IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE

论文:https://courses.csail.mit.edu/6.869/handouts/PAMIMeanshift.pdf

Meanshift是基于像素聚类的代表方法之一,是一种特征空间分析方法。密度估计(Density Estimation) 和mode 搜索是Meanshift的两个核心点。对于图像数据,其分布无固定模式可循,所以密度估计必须用非参数估计,选用的是具有平滑效果的核密度估计(Kernel density estimation,KDE)。Meanshift 算法的稳定性、鲁棒性较好,有着广泛的应用。但是分割时所包含的语义信息较少,分割效果不够理想,无法有效地控制超像素的数量,且运行速度较慢,不适用于实时处理任务。

TOP2-Normalized cuts and image segmentation

被引频次:8056
作者:Shi JB,Malik J
发布信息:2000,IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE 论文:https://ieeexplore.ieee.org/abstract/document/1000236

论文:https://pdfs.semanticscholar.org/d5d0/2b093162096005834ee22def530de6c1f7eb.pdf

NormalizedCut是基于图论的分割方法代表之一,与以往利用聚类的方法相比,更加专注于全局解的情况,并且根据图像的亮度,颜色,纹理进行划分。

Top1-Fully Convolutional Networks for Semantic Segmentation

被引频次:8170
作者: Long Jonathan,Shelhamer Evan,Darrell Trevor
发布信息:2015,IEEE Conference on Computer Vision and Pattern Recognition (CVPR)
论文:https://arxiv.org/abs/1411.4038
代码:https://github.com/shelhamer/fcn.berkeleyvision.org

FCN是图像分割领域里程碑式论文。作为语义分割的开山之作,FCN是当之无愧的TOP1。它提出了全卷积网络(FCN)的概念,针对语义分割训练了一个端到端,点对点的网络,它包含了三个CNN核心思想:

(1)不含全连接层(fc)的全卷积(fully conv)网络。可适应任意尺寸输入。
(2)增大数据尺寸的反卷积(deconv)层。能够输出精细的结果。
(3)结合不同深度层结果的跳级(skip)结构。同时确保鲁棒性和精确性。

图像分割二十年,盘点影响力最大的10篇论文(含论文和源代码)相关推荐

  1. CVPR 二十年,影响力最大的 10 篇论文

    前言 转载于CVPR 二十年,影响力最大的 10 篇论文! 我们将对计算机视觉领域三大顶会之一CVPR在近二十年来中产生的优秀论文进行一个全面的盘点与总结. CVPR是计算机视觉领域三大顶会中唯一一个 ...

  2. 【CV】图像分割二十年,盘点影响力最大的10篇论文

    编辑丨极市平台 极市导读 图像分割(image segmentation)技术是计算机视觉领域的重要的研究方向,近些年,图像分割技术迅猛发展,在多个视觉研究领域都有着广泛的应用.本文盘点了近20年来影 ...

  3. 图像分割二十年,盘点影响力最大的10篇论文

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 导读 图像分割(image segmentation)技术是计算机视觉领域的重要的研究方向,近些年,图 ...

  4. 图像分割20年,盘点影响力最大的10篇论文

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 导读 图像分割(image segmentation)技术是计算机 ...

  5. FlyAI资讯:收藏!深度学习必读10篇经典算法论文总结!

    前言 目录 前言 1998年:LeNet 2012年:AlexNet 2014年:VGG 2014年:GoogLeNet 2015年:Batch Normalization 2015年:ResNet ...

  6. 解读 | 2019年10篇计算机视觉精选论文(中)

    导读:2019 年转眼已经接近尾声,我们看到,这一年计算机视觉(CV)领域又诞生了大量出色的论文,提出了许多新颖的架构和方法,进一步提高了视觉系统的感知和生成能力.因此,我们精选了 2019 年十大 ...

  7. 专家票选! 2020 年度 10 篇人工智能经典论文(6-10)

    内容提要:近日,多家机构发布了关于人工智能的年终回顾总结,从种种表现来看,疫情之下,AI 依然蓬勃发展,全球 AI 产业规模达到 1500 多亿美元.这背后,又有哪些突破性的研究值得关注? 关键词:A ...

  8. 解读 | 2019 年 10 篇计算机视觉精选论文(中)

    By 超神经 内容一览:2019 年转眼已经接近尾声,我们看到,这一年计算机视觉(CV)领域又诞生了大量出色的论文,提出了许多新颖的架构和方法,进一步提高了视觉系统的感知和生成能力.因此,我们精选了 ...

  9. 中小型研发团队架构落地实践18篇,含案例、代码

    1 写在前面 中小型研发团队很多,而社区在中小型研发团队架构实践方面的探讨却很少.中小型研发团队特别是 50 至 200 人的研发团队,在早期的业务探索阶段,更多关注业务逻辑,快速迭代以验证商业模式, ...

最新文章

  1. 前后端分离 集群负载均衡 分布式 微服务
  2. 服务器搭建tomcat,通过url访问视频
  3. linux 下如何升级CMAKE?(安装指定版本cmake)(高版本cmake)(不删除之前的,可以用软连接)
  4. 初入R语言,绘制heatmap图
  5. 批处理for命令详解(转) 批处理for命令详解
  6. 2014年4月5日 java集合框架总结2--List接口及其子类
  7. 数据质量提升_合作提高数据质量
  8. 熵值法确定权重(matlab附代码)
  9. Nginx 中 nginx.conf 详解
  10. SQL Server 2012新增的内置函数尝试
  11. AE(4)实例:更换衣服色彩
  12. 展讯8541E:NFC PM1810驱动调试
  13. 菜鸟和老鸟都无法避免的问题——未将对象引用设置到对象的实例
  14. JConsole使用教程
  15. 关于android端打开附件(pdf,cad,office等)方式的调查探究
  16. [转]色度抽样(4:2:0)到底是什么意思?
  17. 【基础入门题031】三色球问题
  18. python工作技巧_能让你工作事半功倍的python小技巧大合集
  19. WHM不可不说的几件事?
  20. 2021级cpp上机练习题第16次(综合练习)

热门文章

  1. 计算机学什么怎么学会的,学电脑先学什么 新手怎么学电脑
  2. 2021玉林芳草中学高考成绩查询,「分数线」2020年成都玉林中学招生录取分数线...
  3. 在线选课系统UML大作业
  4. 如何解决未能初始化战场服务器,解决绝地求生无法初始化steam教程详解
  5. 进入JavaScript
  6. BDD之cucumber
  7. 从移动到桌面—ARM挑战X86
  8. 类比C++ 学习Python的class
  9. Spring Cloud的Ribbon-Hystrix-Feign
  10. python图形化编程wx_慢步python,图形用户界面库:wxPython库 初体验,先建一个窗体...