1. 缘起
  2. 三维感知
  3. 目标识别
    3.0. 目标是什么
    3.1. 图像分割
    3.2. 纹理与材质
    3.3. 特征提取与描述
  4. 目标(和自身)在三维空间中的位置关系
  5. 目标的三维形状及其改变、目标的位移
  6. 符号识别
  7. 数字图像处理

图像分割

为了通过材质、形状、结构识别目标,对图像进行分割应该是必然的选择。在这一点上计算机视觉研究者们算是勉强达成了共识,图像分割甚至被不少研究者列为计算机视觉的基本任务之一了。那么图像分割到底是什么呢?不幸的是图像分割任务的定义中仅“分割结果是不重叠的子区域”这一部分获得了共识,对于子区域的粒度、边界保持性、区域内纹理一致性等等缺乏有效和公认的标准。虽然如此,很多图像分割算法被提了出来,归纳起来可以分为基于阈值的方法、基于聚类的方法、基于区域的方法、基于图割的方法、活动边界模型和水平集、基于卷积神经网络的方法。

基于阈值的方法里,有全局一个阈值的,也有对图像不同区域使用不同阈值的。此类方法的关键在于确定阈值,然而对于大多数图像即使遍历所有的取值也无法找到实现合理分割的阈值,因此该算法常用于符号识别、指纹识别和分割遥感领域中的各种指数图像(水体指数、植被指数、干旱指数、热红外影像)。

凡是认真思考或者亲身尝试过的,都会承认基于聚类的方法的分割结果难以令人接受。所有的聚类算法都直接或者间接假设了类别内部的样本密度高于类别边界的样本密度。观察过一些图像的直方图后就会发现,像素在像元值空间的分布形状通常都类似钟型曲线(只有一个凸起),也就是说按照聚类算法的假设应该将全部像素聚为一类。即使同时使用多个图像通道,这种情况也没有什么改观。没有或者难以使用空间信息是基于聚类的方法的直接缺陷,导致分割结果形状复杂、越过显而易见的边界。通常基于聚类的方法都作为其他算法的预处理步骤,在图像处理领域用于压缩颜色数量。

基于聚类的方法中有一个叫做SLIC的超像素分割算法与基本的聚类算法有较大的不同,首先在图像上均匀的撒上种子点,然后以一定的半径执行KMeans聚类,所使用的距离度量方法考虑到了空间信息。该算法与方格网形划分超像素相比有很大的优势,但是由于聚类算法的用于分割的天然缺陷仍然会导致超像素越过显而易见的边界。如果目标是为了保持形状的准确性,SLIC并不是很好的预处理选择

基于区域的方法目前包含种子区域生长、区域分裂和合并、分水岭。种子区域生长法的关键在于种子点的选择、相似性的度量、生长规则,其中相似性度量最为关键。常用的相似性度量方法有像元值、颜色、纹理,相似性的度量也是区域分裂和合并法的最关键所在。区域分裂和合并的另外一个关键是分裂和合并的机制。分水岭算法通常应用在梯度图上,将梯度值看作高程值,设想从高程值的局部极小值处向外涌水,整幅图上水位升高的速度是一样的,在两处涌水相遇处修建堤坝。当水位上升至最高点后,所有像素点都被淹没,所有的堤坝形成对图像的分割。分水岭算法对微弱的边缘也有很好的响应,因而也会导致过分割。对于保持形状来说,分水岭加区域分裂和合并应该还有较大的提升空间

基于图割的方法是将图像分割转换为图的最小割问题,关键在于设置边的权重,这只不过是相似性度量的另一个称呼。因此基于图割的全图分割方法并不会比种子区域生长、区域分裂和合并更好;此外最小割是NP问题,难以最优求解。基于图割的方法中值得一提的是Graphcut和Grabcut,该算法用于分割前背景,需要人工粗略标注部分背景和前景。这两个算法的直接意义在于图像处理领域的交互式前景提取。

活动边界模型和水平集的用处同样在于交互式前景提取,需要人工提供初始前景范围曲线,然后让范围曲线在根据图像数据得到的能量函数的作用下演化,使其向前景边缘逐渐逼近,最终找到前景的边缘,在达到前景边缘时能量函数的取值最小。活动边界模型直接对范围曲线进行演化,而水平集则根据图像数据构造出三维曲面,通过三维曲面的演化以及取等值线的方式间接实现范围曲线的演化。前背景的边缘处一定具有较大的梯度,因此能量函数最重要的构造依据就是图像的梯度,仅依靠梯度会陷入局部最优,一般还会加入曲线的曲率和其它先验知识。活动边界模型和水平集方法不过是希望通过曲线和曲面的传递作用以及其它先验突破梯度的局部极大值,在前景分割上的表现不会比基于图割的方法更好,事实也是如此。

基于卷积神经网络的方法包括语义分割、实例分割、全景分割三种,归根到底都是通过已知的样本数据建立像素及其一定范围内领域的像素到实例或者类别的映射。得益于神经网络能够模拟任意函数的优势,在大量样本数据参与训练的条件下所建立出来的映射模型具有较高的准确性。然而机械的映射模型具有显而易见的缺陷,迁移能力(只能分割猫的网络不能分割狗)和泛化能力(只能分割白猫的网络分割不了花猫)几乎没有。另外由于映射模型过分复杂,输入数据的轻微改变也会导致无法预料的错误(像素攻击)。但是卷积神经网络带来的效果提升似乎说明了“在没有识别出目标的情况下是达不到完美分割效果的”。

以上就是图像分割的所有进展,凡是有过尝试的人都会承认,即使人类也很难从目前图像分割的结果中提取出形状和结构特征。不禁要问,在没有识别出目标的情况下,到底能够分割到什么程度?目前图像分割算法是否还能继续提升?就我个人的感觉,目前的进展还未达到图像分割的极限,虽然不可能达到人类的水平,但是仍然有很大的提升空间。关键的问题是朝着什么方向去提升,也就是应该用什么指标来评价图像分割能力的提升?对于这个问题的回答不妨采用逆向思维,从图像分割的目的出发。既然图像分割的目的是为了便于识别,那么就要问,对于识别来说子区域的那些特征才是有价值的?从笔者的观察和体会来看,过分割程度和边界准确程度是至关重要的。

目前图像分割算法的评价指标都是基于IOU的,IOU直接强调的是面积,而面积对于图斑来说是区分度非常差的特征。对于很多形状复杂的自然目标来说,IOU大但是形状和结构则相去甚远,因此基于IOU的评价指标对于强调形状和结构没有任何价值。但是目前并没有形状和结构特征的描述方法,仿佛陷入了进退两难的境地。

其实不难看出,如果边界是准确的,那么将准确的边界连接起来就能形成准确的分割。边界的少量错位是在所难免的,因此在评价边界的准确性时需要允许一定程度的错位。但是若果边界有缺失,则无论如何也无法恢复形状和结构了。至此,分割算法的一项评价指标就呼之欲出了——边界缺失率,与之对应的另一项评价指标则是——边界冗余率。边界准确程度和过分割程度已经在这两个指标中包含了。

cv曲线面积的意义_【CV现状-3.1】图像分割相关推荐

  1. cv曲线面积的意义_一篇搞定电动调节阀口径和Cv值计算

    决定调节阀口径应根据已知的流体条件,计算出必要的Cv值,然后再根据调节阀的额定Cv值,选取合适的调节阀口径. 一. Cv值计算公式 Cv值是用来表示调节阀的英制单位流量系数.其定义是:阀处于全开状态, ...

  2. cv曲线面积的意义_几何直觉的魅力:sinx曲线下的面积原理是如此的美妙

    用"曲线下的面积"来描述积分,就像用一串单词来描述一本书. 正弦函数的积分是其曲线下的面积.几何直觉就是:"正弦的积分是沿圆周路径的水平距离."这句话第一次听说 ...

  3. cv曲线面积的意义_【材料】塑性材料名义(工程)应力-应变曲线图

    样件的材料特性:塑性 样件承受的力:拉力 下图为材料理论特性曲线图: Nominal Stress-Strain Curve Diagram *注意,上图与国内版曲线图存在差异,下文讲. 线弹性阶段 ...

  4. cv曲线面积的意义_南昌大学陈义旺、武汉大学闵杰《AFM》:大面积有机太阳能电池中一种减少非辐射复合损耗的有效方法...

    [研究背景] 有机太阳能电池具有轻质.低成本.可弯折.高透光等优点,有望应用于便携式充电设备,光伏建筑一体化等领域,近年来由于新材料的开发以及界面工程的不断优化,有机太阳能电池(OSCs)的效率也在不 ...

  5. cv曲线面积的意义_耳机的瀑布图真的有意义吗?关于耳机的瀑布图,你需要知道的。...

    其实这个问题我一直不太想写,因为这是个很基础的问题,但是很多人都说"耳机不能只看频响,不能只看三频均衡,还要看素质,看瞬态",素质也好,音质也罢,之前写过很多文章,耳机的非线性失真 ...

  6. cv曲线面积的意义_关于粒径及粒度分布的定义及其在粉末涂料生产中的指导意义...

    摘要:粒径和粒径分布式粉末涂料的重要参数,文章介绍了粉体材料的粒径和粒径分布定义,表示方法,以及在粉末涂料生产中的指导意义. 1.粒径的定义 当被测颗粒的某种物理特性或物理行为与某一直径的同质球体(或 ...

  7. cv曲线面积的意义_「初中数学」与反比例函数有关的面积专题

    [知识储备] 1.双曲线y=K/x上有一点P,S△POA=1/2|K|,S矩形PAOB=|K|(PA⊥x轴于点A,PB⊥y轴于点B). 2.xy=K,设P点坐标为(x,y).通常以此设双曲线上点的坐标 ...

  8. cv曲线面积的意义_评价标准专题:常见的TP、TN、FP、FN和PR、ROC曲线到底是什么...

    评价标准 True positives(TP,真正) : 预测为正,实际为正 True negatives(TN,真负):预测为负,实际为负 False positives(FP,假正): 预测为正, ...

  9. cv曲线面积的意义_关于离散信号Parseval定理的物理意义

    奥本海姆所著<信号与系统>(刘树棠译版)中关于Parseval定理的描述如下: 信号的能量既可以按每单位时间的能量在整个时间内积分出来,也可以按每单位频率的能量在整个频率范围内积分而得到. ...

最新文章

  1. 系统高可用设计与实践
  2. python跟php如何共用mysql_Python 3 多个函数共用一个mysql连接
  3. 通过Rman定期删除归档脚本
  4. Cookie的使用(js-cookie插件)
  5. asp.net core监控—引入Prometheus(六)
  6. SpringCloud创建Config多客户端公共配置
  7. vc可以实现对话框里显示html文档内容,也可以显示word内容吗,VC6中使用CHtmlView在对话框控制中显示HTML文档...
  8. java中某对象的引用什么意思_在java中,引用对象变量和对象间有什么关系?()
  9. DiskGenius无损调整C盘容量方法
  10. buffer pool mysql_理解Mysql中的Buffer pool
  11. MVC 《web考勤管理系统》 项目研发文献
  12. vue添加响应response拦截器,响应登陆超时处理
  13. win7访问服务器共享文件夹提示没有权限,win7系统无法访问共享文件夹提示权限不足的解决方法...
  14. 转【iOS应用安全】游戏安全之IPA破解原理及防御
  15. 搭建自动化测试平台(selenium+testng+maven+svn+Jenkins)【转自galen2016】
  16. 商品详情页商品属性选择,包含多规格
  17. CBAM CBAM: Convolutional Block Attention Module
  18. python获取网页内容 不打开_网页抓取python不返回任何内容
  19. 【FXCG】美联储政策上升不确定 美元指数波动加大
  20. Vue 点击文字改变文字颜色

热门文章

  1. Jquery(终极完整版)
  2. oracle 等待的进程,Oracle 等待事件:ges generic event
  3. PathAFL论文阅读+源码分析
  4. 职场:“工作”的理解
  5. 建立完善的员工晋升机制_【员工晋升机制】多渠道员工晋升机制如何建立
  6. 数据库第一类第二类丢失更新
  7. 多传感器融合定位四-3D激光里程计其四:点云线面特征提取
  8. C#读取Excel数据的几种方式(包含大量数据读取)
  9. 基于java的springboot电影院订票售票系统毕业设计springboot开题报告
  10. 除法竖式在MathType中该怎样进行编辑