SIGGRAPH2018黑科技:开源语义软分割改进图像编辑

原文:https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&mid=2247483947&idx=1&sn=beda88fb72014e8c9de394ed3dfea798&chksm=96f3707fa184f969f6ff1673d9350465bd0cd7492bf13b1fa4abf6890ad50a25d07dbab30eb7&scene=21#wechat_redirect

语义软分割(Semantic Soft Segments),旨在精确表示图像不同区域间的软过渡. 类似于磁力套索(magnetic lasso) 和魔术棒(magic wand) 的功能.

普通语义分割将每个像素分配到一个类,语义软分割中则每个像素有可能分配到多个类,且目标之间的过渡区域平滑,这对于图像编辑是非常重要的。以往这需要专业的PS人员处理,而本文通过扩展传统的语义分割,将这个过程实现自动化。

作者已经将代码开源。

先来看段视频,你就知道这是释放了AI魔法对生产力的又一次解放^_^

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)

本文来自即将召开的SIGGRAPH2018的论文《Semantic Soft Segments》。

semantic soft segments, a set of layers that correspond to semantically meaningful regions in an image with accurate
soft transitions between different objects.

从谱分割(spectral segmentation) 角度来解决 soft segmentation 问题,提出的图结构(Graph Structure),既考虑了图片的纹理和颜色特征,也利用了由深度神经网络生成的更高层的语义信息.
根据仔细构建的 Laplacian 矩阵的特征分解(eigendecomposition) 自动的生成 soft segments.

出发点:
[1] – 能够分割图片中的不同物体,同时精确表示出分割物体间的过渡情况.
[2] – 自动完成分割,不用手工操作.

Semantic Soft Segmentation,自动将图像分解为不同的层,以覆盖场景的物体对象,并通过软过渡(soft transitions) 来分离不同的物体对象.

相关研究方向:

  • Soft segmentation – 将图像分解为两个或多个分割,每个像素可能属于不止一个分割部分.

  • Natural image matting – 估计用于定义的前景区域中每个像素的不透明度. 一般输入是 trimap,其分别定义了不透明的前景,透明的背景以及未知透明度的区域.

  • Targeted edit propagation

  • Semantic segmentation – 语义分割

技术路线

问题描述
给定输入图片,自动生成其 soft 分割结果,即,分解为表示了场景内物体的不同层,包括物体的透明度和物体间的软过渡.
每一层的各个像素由一个透明度值alpha表示. alpha=0 表示完全不透明(fully opaque),alpha=1 表示完全透明(fully transparent),alpha 值在 0-1 之间,则表示部分不透明度.

输入图片的 RGB 像素可以表示为每一层中的像素值与对应的 alpha 值的加权和.

1. 低层特征构建 – Nonlocal ColorAffinity

构建低层次的仿射关系项,以表示基于颜色的像素间较大范围的关联性特征.

主要构建过程:
[1] – 采用 SLIC 生成 2500 个超像素;
[2] – 估计每个超像素和对应于图像 20% 尺寸半径内所有超像素的仿射关系.

2. 高层特征构建 – High-Level Semantic Affinity

虽然 nonlocal color affinity 添加了像素间大范围间的相互作用关系,但仍是低层特征.
这里构建高层语义仿射关系项,以使得属于同一场景物体的像素尽可能的接近,不同场景物体的像素间的关系远离.

3. 图像层创建 – Creating the Layers

通过对 Laplacian 矩阵进行特征分解,提取特征向量,并对特征向量进行两步稀疏处理,来创建图像层.

[1] – 构建 Laplacian 矩阵
[2] – 受约束的稀疏化(Constrained sparsification)
[3] – 松弛的稀疏化(Relaxed sparsification)

4. 语义特征向量 – Semantic Feature Vectors

在高层特征构建时,相同物体的像素的特征向量相似,不同物体的像素的特征向量不同.
特征向量是采用语义分割的深度网络模型训练和生成的.

这里采用了 DeepLab-ResNet-101 作为特征提取器,但网络训练是采用的是度量学习方法,最大化不同物体的特征间的 L2 距离(稍微修改了 N-Pair loss).

在 COCO-Stuff 数据集上进行语义分割网络的训练.
采用 guided filter 将网络生成的 feature map 与图像进行边缘对齐.
然后采用 PCA 降低 feature map 维度到 3.
最后,归一化特征向量值到 [0, 1].

分析实验

在 MATLAB 环境,640×480 的图片处理耗时约为 3 分钟.

Semantic Soft Segmentation 是 semantic segmentation, neural image matting 和 soft segmentation 的交叉.

1. Spectral Matting and Semantic Segmentation

2. Natural Image Matting

3. Soft Color Segmentation

4. Using Semantic Soft Segments for Image Editing

5. Limitations

包含代码的工程主页:

http://people.inf.ethz.ch/aksoyy/sss/

本文来自:

https://www.aiuai.cn/aifarm366.html

SIGGRAPH2018黑科技:开源语义软分割改进图像编辑相关推荐

  1. 深度挖掘论文:《Semantic Soft Segmentation》(语义软分割)

    最近花了一段时间研究英语论文Semantic Soft Segmentation,把自己收集的知识点分享下. ###内容目录 ###论文摘要 深度挖掘论文:<Semantic Soft Segm ...

  2. 飞桨视频理解黑科技开源,支持3000个实用标签

    意料之外,一场疫情解锁了上班族的存封已久厨艺技能,"秒会陕西正宗凉皮"."电饭煲实现蛋糕梦"--无数美食短视频帮助帅哥靓妹登上了厨房的舞台,舌尖上的中国再次风靡 ...

  3. 商汤科技开源DAVIS2017视频目标分割冠军代码

    出处"来自微信公众号:我爱计算机视觉" 商汤科技开源DAVIS2017视频目标分割冠军代码 用目标重识别改进视频目标分割. 传统视频分割经常依赖于时序连续来生成mask(目标的掩膜 ...

  4. 重磅推荐!日立开源语义分割数据集标注工具Semantic Segmentation Editor

    面向自动驾驶领域的2D图片与3D点云对象标注工具. (欢迎关注本站的"我爱计算机视觉"微信公众号,一个有价值有深度的公众号~) 日立汽车工业实验室(Hitachi Automoti ...

  5. 人造电子皮肤、软体机器人、单孔腔镜手术机器人......青年科学家们都在研究哪些“黑科技”?...

    8 月 25 日,2017 世界机器人大会人工智能与机器人青年创新创业专题论坛在京召开,本次论坛由中国电子学会-嵌入式系统与机器人分会主办,雅瑞资本.真格基金.立德共创承办,并由多家大学.创投机构.新 ...

  6. 【宝藏】GitHub黑科技的开源项目(有趣高质量)

    博主收集整理 GitHub 上高质量.有趣的开源项目,并将他们进行归类.值得注意的是,不是简单的按照编程语言来分类,而是按照更有趣的分类方式,比如:有趣项目.沙雕项目.实战项目.学习项目.实用工具等等 ...

  7. 语义分割改进:通过视频传播和标签松弛

    语义分割改进:通过视频传播和标签松弛 Improving Semantic Segmentation via Video Propagation and Label Relaxation 论文地址:h ...

  8. 【数据竞赛】竞赛宝典黑科技:基于开源结果的高端融合策略

    作者: 尘沙杰少,樱落 竞赛宝典黑科技_基于开源结果的融合 (轻轻松松挖银牌) 背景 本篇文章的思想很简单,不需要自己跑任何的模型,只需要将现有的开源提交结果进行"直接优化两步走" ...

  9. 筛选Github优秀开源项目一(黑科技篇)

    文章目录 1.中文诗歌汇总 2.12306抢票 3.文言文编程 4.程序员找工作黑名单 5. 955的公司 6. 买房经验 7.简历模板 8.英语进阶指南 9. 谷歌插件排行榜 10. 程序员考公指南 ...

最新文章

  1. 张仰彪第二排序法_十大排序之冒泡和选择排序
  2. Dell Fluid FS 集群NAS系统在4K非编环境的卓越表现
  3. cannot restore segment prot after reloc
  4. micropython esp32手册_使用ESP32控制板(二):燒錄MicroPython韌體
  5. Mac系统下安装MySQL详细步骤
  6. fft 相位谱_基于级联FFT的广义互相关算法在声源定位中的应用
  7. ActiveX插件的Z-Index属性无效问题解决
  8. 2、计算浮点数相除的余数
  9. hantomjs能解析出html源码吗,网页源码是js js跳转后才是源码 怎么用易语言写 不使用超文本 有延时...
  10. phpstudy免费安全检测服务_@你,您有一份免费安全服务已到账
  11. oracle 登录dba,在Oracle10gisqlplus下登录dba用户
  12. angular学习资源
  13. 通讯(transport)
  14. 服务器上怎么查询ubuntu版本信息失败,Ubuntu安装包信息如何查看
  15. sql日期和时间函数
  16. 软件测试——全链路压测原理
  17. Qt与flash交互实现(播放Flash动画)
  18. 前端基础01 HTML
  19. eclipse制作app入门教程
  20. unity新粒子系统的碰撞和触发

热门文章

  1. Makefile文件和shell脚本
  2. 嵌入式系统中进程间通信的监视方法
  3. java自带的resize方法_java对图片进行压缩和resize缩放的方法
  4. mysql 比较大小 慢_MYSQL慢查询优化方法及优化原则
  5. lua 的正则表达式之坑
  6. Linux 系统调用(一)
  7. android 安装 apk 7.0,android 7.0及以上版本安装apk
  8. java可以多重继承吗_Java中的多重继承与组合vs继承
  9. wps分享为什么要登入_【知识点分享】钢筋上的螺纹有什么作用?为什么要有螺纹?...
  10. csdn java社区_java中的io系统详解 - ilibaba的专栏 - 博客频道 - CSDN.NET