图像分割过分割和欠分割

Image segmentation technology is an important research direction in the field of computer vision and an important part of image semantic understanding. Image segmentation refers to the process of dividing an image into several areas with similar properties. From a mathematical point of view, image segmentation is the process of dividing an image into disjoint areas.The area can be the foreground and background of the image or a single object. These areas can be constructed using features such as color, edges, or similarity of neighbors.

图像分割技术是计算机视觉领域的重要研究方向,也是图像语义理解的重要组成部分。 图像分割是指将图像划分为多个具有相似属性的区域的过程。 从数学的角度来看,图像分割是将图像划分为不相交的区域的过程,该区域可以是图像的前景和背景,也可以是单个对象。 可以使用诸如邻居的颜色,边缘或相似性之类的特征来构造这些区域。

Graph cutting algorithm is one of the classic algorithms of combinatorial graph theory. In recent years, many scholars have applied it to image and video segmentation and achieved good results. This article briefly introduces the graph cut algorithm and interactive image segmentation technology, as well as the application of graph cut algorithm in interactive image segmentation.

图切割算法是组合图理论的经典算法之一。 近年来,许多学者将其应用于图像和视频分割,并取得了良好的效果。 本文简要介绍了图割算法和交互式图像分割技术,以及图割算法在交互式图像分割中的应用。

基本概念 (Basic concept)

We use the theories and methods in the field of graph theory to map the image into a weighted undirected graph, treat the pixels as nodes, and regard the image segmentation problem as the vertex division problem of the graph, using the smallest cutting criterion to obtains the best segmentation of the image.

我们使用图论领域中的理论和方法,将图像映射成加权无向图,将像素作为节点,并将图像分割问题视为图的顶点划分问题,并使用最小的切割准则获得图像的最佳分割。

This type of method associates the problem of image segmentation with the problem of MIN-CUT . The usual approach is to map the image to be segmented into a weighted undirected graph G=(V, E), where , V is the set of vertices, and E is the set of edges.

这种类型的方法将图像分割问题与MIN-CUT问题联系起来。 通常的方法是将要分割的图像映射到加权无向图G =(V,E),其中,V是顶点集,E是边缘集。

The edge formed by the connection of every two neighboring vertices are called n-links and the connection between each ordinary vertex and the two terminal vertices are called t-links.

每两个相邻顶点之间的连接所形成的边称为n-link ,每个普通顶点与两个终端顶点之间的连接称为t-link。

Each node corresponds to each pixel in the image, and each edge ∈ E connects a pair of adjacent pixels, and the weight of the edge is w(i,j) represents the non-negative similarity in gray, color or texture between adjacent pixels.

每个节点对应于图像中的每个像素,每个边缘∈E连接一对相邻的像素,并且边缘的权重为w(i,j)表示相邻像素之间在灰度,颜色或纹理上的非负相似度。

Boykov and Jolly originally proposed to compute the histograms of the labeled pixels to approximate probability density functions , and to let

Boykov和Jolly最初提出计算标记像素的直方图,以近似概率密度函数,并让

For example, if fB is very low, then wi,F will be very high, making it much more likely that the edge between i and B is cut. The inter-node weights are computed using a simple similarity measure

例如,如果fB非常低,则wi,F将非常高,从而更有可能切割i和B之间的边缘。 使用简单的相似性度量来计算节点间权重

Blake et al. showed how the parameter σ could be estimated based on the local contrast of an image sample.

布莱克等。 展示了如何根据图像样本的局部对比度估计参数σ。

We take a two-category division as an example, divide G = (V,E) into two subsets A, B .These two subsets correspond to the foreground pixel set and the background pixel set of the image, which is equivalent to completing the image segmentation, where:

我们以两类划分为例,将G =(V,E)划分为两个子集A,B,这两个子集分别对应于图像的前景像素集和背景像素集,相当于完成了图像分割,其中:

A segmentation S of an image is a cut of the image, and each region C ∈ S that is segmented corresponds to a sub-image in the image. It is normal in combinatorial optimization to define the cost of a cut as the sum of the costs of the edges that it severs.

图像的分割S是图像的切割,并且被分割的每个区域C∈S对应于图像中的子图像。 在组合优化中,将切割的成本定义为切割的边的成本之和是正常的。

The cost of the cut is the sum of the weights of all edges in the edge set C.If a cut has the smallest sum of weights of all edges, then this cut is called a minimum cut.

切割的成本是边集C中所有边的权重的总和。如果切割的所有边的权重总和最小,则此切割称为最小切割。

Maxflow–Mincut定理 (Maxflow–Mincut Theorem)

图流 (Flow in a graph)

We consider a directed graph (S, A), with afinite set of vertices S and a set of arcs which connect some of these vertices .

我们考虑一个有向图(S,A),它具有一组有限的顶点S和一组连接这些顶点中的一些的弧。

Among the vertices are distinguished the source S, and the well P.With each arc is associated a strictly positive real number, called capacitance .

在顶点之间可以区分出源S和阱P。每个圆弧都有一个严格的正实数,称为电容。

We seek to pass a maximum flow of a liquid , from the source to the well — the flow in each arc not exceeding its capacity. In other words, we are looking for a function f of the set of arcs in R such that:

我们力求使液体的最大流量从源头流向井-每个电弧中的流量均不超过其容量。 换句话说,我们正在寻找R中的一组弧的函数f,使得:

  • for any arc a, 0≤f (a) ≤c (a), where c (a) is the capacity of the arc.对于任何弧a,0≤f(a)≤c(a),其中c(a)是弧的容量。
  • for any vertex other than the source or the well, the sum of the flow rates of the incoming arcs is equal to the sum of the flows of the outgoing arcs.对于除源或井以外的任何顶点,输入弧的流率之和等于输出弧的流之和。

We speak of a flow for such an application. We seek to determine a maximum flow , in the sense that

我们谈到了此类应用程序的流程 。 我们试图确定最大流量

  • The sum of the flow rates of the arcs leaving the source is maximum.离开源头的电弧的流量之和最大。

Here is an example of a flow .

这是流程的示例。

However, it is not maximum,it can for example be improved by adding a bit rate of 1 on the S-a-b-d-e-P path .

但是,它不是最大的,例如可以通过在SabdeP路径上添加1的比特率来改善

There are several algorithms to achieve maximum flow, such as Dinic or ISAP algorithm.

有几种算法可以实现最大流量,例如Dinic或ISAP算法。

最小割 (Minimum cut)

The value of a maximum flow is equal to the value of a minimum cut.

最大流量的值等于最小切割的值。

Moreover, if (A, B) is a minimal cut, and that a is an arc having its start in A and its end in B, is saturated by any maximum flow.

此外,如果(A,B)是最小切口,并且a是在A处开始而B处结束的弧,则任何最大流量都将其饱和。

结论 (Conclusion)

This lesson cover the basic, low-level operations and tools of image processing, which are necessary for understanding most of the commonly used methods and tools of computer vision.

本课程涵盖图像处理的基本,低级操作和工具,这对于理解计算机视觉的大多数常用方法和工具都是必需的。

提价 (Refrences)

  1. Yuri Y. Boykov Marie-Pierre Jolly.Interactive Graph Cuts for Optimal Boundary & Region Segmentation of Objects in N-D ImagesYuri Y.Boykov Marie-Pierre Jolly。交互式图割用于ND图像中对象的最佳边界和区域分割
  2. A. Blake, C. Rother, M. Brown, P. Pérez, and P. Torr. Interactive image segmentation usingan adaptive GMMRF model. InEuropean Conference on Computer Vision (ECCV), 2004.A. Blake,C。Rother,M。Brown,P。Pérez和P. Torr。 使用自适应GMMRF模型进行交互式图像分割。 在欧洲计算机视觉会议(ECCV)上,2004年。
  3. Yuri Boykov, Vladimir Kolmogorov: An Experimental Comparison of Min-Cut/Max-Flow Algorithms for Energy Minimization in Vision. IEEE Trans. Pattern Anal. Mach. Intell. 26(9): 1124–1137 (2004)尤里·博伊科夫(Yuri Boykov),弗拉基米尔·科莫莫洛夫(Vladimir Kolmogorov):最小切割/最大流量算法在视觉上实现能量最小化的实验比较。 IEEE Trans。 模式肛门。 马赫 智力 26(9):1124-1137(2004)
  4. Adelson, Edward H., and James R. Bergen (1991), “The plenoptic function and the elements of early vision”, Computational models of visual processing 1.2 (1991).

    Adelson,Edward H.和James R. Bergen(1991年),“ 全光功能和早期视觉的要素 ”,视觉处理1.2的计算模型(1991年)。

  5. Boykov, Y., Veksler, O., and Zabih, R. (2001), “approximate energy minimization via graph cuts,” IEEE Transactions on Pattern Analysis and Machine Intelligence, 23(11): 1222–1239.

    Boykov,Y.,Veksler,O.和Zabih,R.(2001),“ 通过图割实现近似能量最小化 ”,《 IEEE模式分析和机器智能交易 23(11):1222-1239。

  6. D.M. Greig, B.T. Porteous and A.H. Seheult (1989), Exact maximum a posteriori estimation for binary images, Journal of the Royal Statistical Society, Series B, 51, 271–279.

    DM基利,BT波蒂厄斯和AH Seheult(1989), 精确最大为二进制图像后验估计 ,杂志皇家统计学会,B系列,51,271-279的。

  7. D. Geman and S. Geman (1984), Stochastic relaxation, Gibbs distributions and the Bayesian restoration of images, IEEE Trans. Pattern Anal. Mach. Intell., 6, 721–741.

    D. Geman和S. Geman(1984), 随机松弛,Gibbs分布和图像的贝叶斯复原 ,IEEE Trans。 模式肛门。 马赫 INTELL,6,721-741。

  8. J.E. Besag (1986), On the statistical analysis of dirty pictures (with discussion), Journal of the Royal Statistical Society Series B, 48, 259–302.

    JE Besag(1986年), 在肮脏的照片(与讨论)的统计分析 , 皇家统计学会的 B系列,48,259-302。

翻译自: https://medium.com/swlh/image-segmantation-using-graph-cut-540ada07c327

图像分割过分割和欠分割


http://www.taodudu.cc/news/show-863526.html

相关文章:

  • 跳板机连接数据库_跳板数据科学职业生涯回顾
  • 模糊图像处理 去除模糊_图像模糊如何工作
  • 使用PyTorch进行手写数字识别,在20 k参数中获得99.5%的精度。
  • openai-gpt_您可以使用OpenAI GPT-3语言模型做什么?
  • 梯度下降和随机梯度下降_梯度下降和链链接系统
  • 三行情书代码_用三行代码优化您的交易策略
  • 词嵌入 网络嵌入_词嵌入简介
  • 如何成为数据科学家_成为数据科学家的5大理由
  • 大脑比机器智能_机器大脑的第一步
  • 嵌入式和非嵌入式_我如何向非技术同事解释词嵌入
  • ai与虚拟现实_将AI推向现实世界
  • bert 无标记文本 调优_使用BERT准确标记主观问答内容
  • 机器学习线性回归学习心得_机器学习中的线性回归
  • 安全警报 该站点安全证书_深度学习如何通过实时犯罪警报确保您的安全
  • 现代分层、聚集聚类算法_分层聚类:聚集性和分裂性-解释
  • 特斯拉自动驾驶使用的技术_使用自回归预测特斯拉股价
  • 熊猫分发_实用熊猫指南
  • 救命代码_救命! 如何选择功能?
  • 回归模型评估_评估回归模型的方法
  • gan学到的是什么_GAN推动生物学研究
  • 揭秘机器学习
  • 投影仪投影粉色_DecisionTreeRegressor —停止用于将来的投影!
  • 机器学习中的随机过程_机器学习过程
  • ci/cd heroku_在Heroku上部署Dash或Flask Web应用程序。 简易CI / CD。
  • 图像纹理合成_EnhanceNet:通过自动纹理合成实现单图像超分辨率
  • 变压器耦合和电容耦合_超越变压器和抱抱面的分类
  • 梯度下降法_梯度下降
  • 学习机器学习的项目_辅助项目在机器学习中的重要性
  • 计算机视觉知识基础_我见你:计算机视觉基础知识
  • 配对交易方法_COVID下的自适应配对交易,一种强化学习方法

图像分割过分割和欠分割_使用图割的图像分割相关推荐

  1. microbit编程_使用图形化编程实现主控板与手机蓝牙通讯(2019.3.25)

    本文转自:DFRobot创客社区 原文链接: [Mind+]使用图形化编程实现主控板与手机蓝牙通讯-Mind+论坛-DF创客社区​mc.dfrobot.com.cn 本帖最后由 Forgotten 于 ...

  2. gcn在图像上的应用_使用图卷积网络(GCN)做图像分割

    Title: Graph-FCN for image semantic segmentation 论文网址:https://arxiv.org/pdf/2001.00335.pdf 作者:Yi Lu1 ...

  3. 【图像分割模型】快速道路场景分割—ENet

    这是专栏<图像分割模型>的第4篇文章.在这里,我们将共同探索解决分割问题的主流网络结构和设计思想. 有了空洞卷积,这篇文章我们通过ENet看看在实际任务中,该怎么用好空洞卷积. 作者 | ...

  4. 语义分割和实例分割_语义分割入门的一点总结

    点击上方"CVer",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:Yanpeng Sun https://zhuanlan.zh ...

  5. 语义分割和实例分割_一文读懂语义分割与实例分割

    以人工智能为导向的现代计算机视觉技术,在过去的十年中发生了巨大的变化.今天,它被广泛用于图像分类.人脸识别.物体检测.视频分析以及机器人及自动驾驶汽车中的图像处理等领域.图像分割技术是目前预测图像领域 ...

  6. Keras图像分割实战:数据整理分割、自定义数据生成器、模型训练

    Keras图像分割实战:数据整理分割.自定义数据生成器.模型训练 目录 Keras图像分割实战:数据整理分割.自定义数据生成器.模型训练

  7. 【图像分割应用】医学图像分割(三)——肿瘤分割

    这是专栏<图像分割应用>的第3篇文章,本专栏主要介绍图像分割在各个领域的应用.难点.技术要求等常见问题. 肿瘤的分割是医学图像分析领域的一个重要内容,相比较前面提到过的脑区域分割和心脏分割 ...

  8. 【图像分割应用】医学图像分割(二)——心脏分割

    这是专栏<图像分割应用>的第2篇文章,本专栏主要介绍图像分割在各个领域的应用.难点.技术要求等常见问题. 相比较脑区域分割,医学图像中的心脏分割问题要更复杂,因为心脏是一个不停运作的器官, ...

  9. mysql数据库水平分割_数据库的水平分割和垂直分割

    在数据库操作中,我们常常会听说这两个词语:水平分割和垂直分割.那么到底什么是数据库的水平分割,什么是数据库的垂直分割呢?本文我们就来介绍一下这部分内容. 1.水平分割: 按记录进分分割,不同的记录可以 ...

最新文章

  1. 设计模式之装饰模式(Java实现)
  2. Hack Knowledges
  3. Centos常用快捷键
  4. Js Date对象 简单操作
  5. 私有化 Serverless Application 的探索与思考
  6. python编程--通过单纯形法和scipy库实现线性规划以及通过拉格朗日来求解非线性
  7. 从网管做到CIO---看如何提升IT人员职业价值
  8. Linux-awk直接修改原文件
  9. NSSM 注册PYTHON服务
  10. 【Java基础】Java网络编程基础
  11. 爱情从来就没有愚人节
  12. IE6 遇到bug及解决办法
  13. ai条码插件免安装_ai cs6条码插件 支持Illustrator cs6的条码生成脚本
  14. python分段函数输入x的值求y的值_C语言编程题 有一分段函数如下,要求用scanf函数输入整数x的值,求y值并在屏幕上输出。有分段函数如下,编程实现输入整...
  15. 在python中解压rar文件
  16. ZZNUOJ_C语言1024:计算字母序号(完整代码)
  17. uni-app 解决软键盘弹起输入框遮盖问题
  18. Abaqus中C3D8R单元和C3D8I单元的区别
  19. 5G + 智能制造 = 未来工厂
  20. error C4996: 'scanf': This function or variable may be unsafe. Consider using scanf_s instead.

热门文章

  1. ASP.NET 例程完全代码版(5)——通过web.config配置数据库连接池
  2. 未雨绸缪:从软件测试到质量保证
  3. Objective-C 高性能的循环遍历 forin - NSEnumerator - 枚举 优化
  4. 使用 rem 实现 适配各种屏幕布局
  5. Python 的and 运算
  6. lightoj 1224
  7. 一个小老板从小公司创业开始做起的过程记录
  8. 用samba服务构建基于企业级的文件共享服务
  9. 在线html差错,易查分在线编辑功能:发现错误随时修改,不用再重新上传表格!
  10. fetch用英语解释_初中英语重点知识点,初中三年必须掌握!