你还在用P.S.等商业软件,滑着鼠标,一点点勾勒图像边缘完成抠图嘛?有些大神可能会说:我可以用蒙板、通道等等高端操作实现超快抠图!但如果能有一个软件可以实现智能全自动抠图,完美保留发丝、树叶等精细边缘,还完全免费,甚至代码全部开源——它不香嘛?

图1 Matting效果展示

这绝对不是画饼,近期一项被称为Matting的算法可算是火爆了AI界,相比于单纯的图像分割技术,它可以根据透明度更进一步的对图像的像素进行分类(如下图),不仅图像中的主体目标被精准抠出,连超精细的毛绒边缘和透明玻璃杯都可以完美抠出!传统的图像分割抠图策略是完全不可达到的,懂行的人看到这里是不是已经激动地汗毛直立了?

图2 Matting原理说明

小编赶紧给大家贴上项目链接地址

墙裂推荐小伙伴们star收藏!

https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.5/Matting

本项目是PaddleSeg团队推出的高性能PP-Matting系列模型,它根据用户对图像分辨率的需求,提供最相匹配的模型,精度上能够在Trimap Free方向达到SOTA级别。此外,本项目还充分考虑了实际部署环境,针对边缘端、服务端等对模型体积等指标进行相应优化。

不仅如此,PaddleSeg团队还特别针对人像进行特殊优化处理,提供了不同场景下的预训练模型及部署模型,既可直接部署使用,也可根据具体任务进行微调,简直贴心到家!

图3 PP-Matting 算法精度说明

PP-Matting已经被开发者们广泛应用在各种场景中,如有爱的萌宠开发者小伙伴们已经实现了”猫像抠图”,给自己可爱的小猫咪DIY了各种酷炫写真。

图4 “猫像抠图”示例

此外,有开发者基于Matting模型,开发了一键上传图片进行抠图的Web Demo,同样欢迎大家在PaddleSeg的github页面访问使用。链接如下:

https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.5/Matting

图5 Web端Matting示例

当然,看到这么好的技术,硬核的小伙伴会关注技术上的实现。一般来说,基于深度学习的Matting分为两大类:

  • 一种是基于辅助信息输入。即除了原图和标注图像外,还需要输入其他的信息辅助预测,如Trimap、背景、交互点等作为辅助信息。

  • 一种是不依赖任何辅助信息,直接实现Alpha预测。


图6 Matting原理说明

而PP-Matting设计的初衷,就是为了能够方便用户快速实现抠图,因此用户在使用时不依赖辅助信息的输入,便可直接获得预测的结果。为了实现更高的效果,PP-Matting设计了Semantic context branch (SCB)、high-resolution detail branch (HRDB)两个分支,分别进行语义和细节预测,通过引导流机制,进行语义引导下的高分辨率细节预测,进而实现Trimap-free高精度图像抠图。

图7 PP-Matting原理示意图

正是由于这一系列的设计,最终让PP-Mattig在不依靠其他输入的情况下,依旧获得了更高精度的预测结果。

欢迎感兴趣的小伙伴们

一起体验Matting的技术魅力

图像集引用说明:

图1、图2源于公开数据集:Distinctions-646

图4源于免费版权图片库https://www.pexels.com/zh-cn/

关注【】公众号

获取更多技术内容~

SOTA级发丝抠图模型PP-Matting开源,支持多场景精细化分割相关推荐

  1. 【Matting】MODNet:实时人像抠图模型-笔记

    paper:MODNet: Real-Time Trimap-Free Portrait Matting via Objective Decomposition (AAAI 2022) github: ...

  2. 【Matting】MODNet:实时人像抠图模型-NCNN C++量化部署

    相关链接: [Matting]MODNet:实时人像抠图模型-onnx python部署 [Matting]MODNet:实时人像抠图模型-笔记 [Matting]MODNet:实时人像抠图模型-on ...

  3. 如何从头训练一个一键抠图模型

    如何从头训练一个一键抠图模型 1. 前言 抠图是图像编辑的基础功能之一,在抠图的基础上可以发展出很多有意思的玩法和特效.比如一键更换背景.一键任务卡通化.一键人物素描化等.正是因为这些有意思的玩法,C ...

  4. 别只关注GPT3!细如发丝的模型更具现实杀伤力!

    这个世界上有两种极具难度的工程:第一种是把很平常的东西做到最大,例如把语言模型扩大成能够写诗写文写代码的GPT-3:而另一种恰恰相反,是把很平常的东西做到最小.               ----王 ...

  5. 用AutoML找到更小、更快、更好的模型,谷歌开源Model Search

    本文转载自机器之心. 作者:Hanna Mazzawi等 编辑:魔王.杜伟 为了帮助研究者自动.高效地开发最佳机器学习模型,谷歌开源了一个不针对特定领域的 AutoML 平台.该平台基于 Tensor ...

  6. 深度长文 | 从FM推演各深度CTR预估模型(附开源代码)

    作者丨龙心尘 & 寒小阳 研究方向丨机器学习,数据挖掘 题记:多年以后,当资深算法专家们看着无缝对接用户需求的广告收入节节攀升时,他们可能会想起自己之前痛苦推导 FM 与深度学习公式的某个夜晚 ...

  7. javascript中0级DOM和2级DOM事件模型浅析

    Javascript程序使用的是事件驱动的设计模式,为一个元素添加事件监听函数,当这个元素的相应事件被触发那么其添加的事件监听函数就被调用: <input type="button&q ...

  8. 业务模型管理平台 开源_在可靠的开源模型上建立业务

    业务模型管理平台 开源 自从我们宣布Nextcloud ,一个ownCloud叉,很多人都问我,我们打算如何建立一个可持续的,健康的开源业务. 我的简短回答是,它需要高度重视在所有利益相关者(用户,贡 ...

  9. 【文献翻译】软件设计级漏洞分类模型-Software Design Level Vulnerability Classification Mode

    摘要 软件安全漏洞的分类无疑有助于对安全相关信息的理解,并加速了对漏洞的分析.缺乏适当的分类不仅阻碍了对它的理解,而且还影响了为集群漏洞设计缓解机制的策略.现在,软件开发人员和研究人员都认为,软件的需 ...

  10. 15个可交互的真实房屋场景,Silvio/李飞飞组开源大型室内场景的模拟环境iGibson...

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 作者:沈博魁.夏斐.李承澍.Roberto Martín-Martín 转载自:机器之心 在这 ...

最新文章

  1. python为什么运行慢_为什么你写的Python运行的那么慢呢?
  2. POJ-2531 Network Saboteur 枚举||随机化
  3. 武汉大学计算机学院毕业合影,武大校长对毕业合影有求必应
  4. stm32 之引脚和各功能模块间关系
  5. windows 下后台启动 redis
  6. 免费学plc的手机app_PLC学吧APP
  7. ERR Slot 741 is already busy (Redis::CommandError)
  8. VMware Workstation Pro安装
  9. nuc7 android tv,第七代的进化,Intel NUC7i3BNH 开箱评测拆解
  10. python统计套利_统计套利——反转定律
  11. Strategic game poj1463
  12. 浅谈mysql的执行计划是何方神圣
  13. ROS运行时出现Couldn‘t find executable错误
  14. Android开发经验谈:这份字节跳动历年校招Android面试真题解析,薪资翻倍
  15. Qt的QImage类
  16. 台式计算机的组成和工作过程,计算机的组成及工作原理【图文】
  17. 诗歌(3)—浣溪沙(细雨)
  18. 基于ARM 的neon介绍以及常用intrinsic函数总结
  19. 限制允许某些IP访问服务器
  20. 重积分 | 重积分与大面包(深刻理解)

热门文章

  1. Louvain 算法的核心思路以及数据结构(最完善版)
  2. TCP-IP协议详解(2) 小喇叭开始广播 (以太网与WiFi协议)
  3. vc 编译的那些事儿 - wowolook的专栏 - CSDN博客
  4. 一些常用的IOS开发网站
  5. 51单片机c语言秒表,51单片机秒表C程序
  6. 通过tinyalsa中的tinymix来实现安卓通话录音的方法
  7. C语言实现阿克曼函数
  8. java整人代码大全_给大家分享个整人代码。很实用
  9. html工资计算页面模板,工资计算表Excel模板
  10. 【笔记】Altera - Quartus II使用方法——工程创建、Modelsim破解/仿真、Verilog编写、举例(待续)