大家好,我是K同学啊!

昨天逛某知名网站的时候,发现了一个有趣的算法,分享给大家

一张任意背景的图片,实现任意切换背景,感受一下:

放个视频,感受更强烈:

MODNet算法展示!

MODNet

MODNet是一个仅需RGB图片输入的实时人像抠图模型

模型学习分为三个部分:语义估计(Semantic Estimation)细节预测(Detail Prediction)和语义细节融合(Semantic-Detail Fusion)。

语义估计(Semantic Estimation):与现有的多模型方法类似,MODNet的第一步是在输入图像中定位人。不同之处在于,这里只能通过编码器来提取高级语义。MODNet的低分辨率分支,它有两个主要优势。首先,语义估计变得更加有效,因为它不再由包含解码器的单独模型来完成。其次,高级表示(I)有助于后续分支和联合优化。我们可以应用任意的CNN骨干toS。为了促进实时交互,我们采用了MobileNetV2[35]架构,这是一种为移动设备开发的独立模型。

细节预测(Detail Prediction):使用了高分辨率分支 D 处理前景肖像周围的过渡区域,它采用 I、S(I) 和来自 Sas 输入的低级特征。重用低级特征的目的是减少D的计算开销。此外,作者在以下三个方面进行就进一步简化:

  • D包含比S更少的卷积层;
  • 为D中的卷积层选择了一个小的通道数;
  • 我们不保持整个D的原始输入分辨率。在实践中,D由12个卷积层组成,其最大通道数为64。特征图分辨率在第一层下采样到1/4,在后两层恢复。此设置对细节预测的影响可以忽略不计。

都想要的

  • 论文地址:https://github.com/ZHKKKe/MODNet
  • 项目地址:https://arxiv.org/pdf/2011.11961.pdf

如果你懒得去看论文也不想敲代码,请看下面,作者早已洞悉大家的急迫上手的心情,代码直接给我们准备好了,只需点一个「运行」按钮即可。

  • 图像:https://colab.research.google.com/drive/1GANpbKT06aEFiW-Ssx0DQnnEADcXwQG6?usp=sharing
  • 视频:https://colab.research.google.com/drive/1Pt3KDSc2q7WxFvekCnCLD8P0gBEbxm6J?usp=sharing

把发丝都能给扣出来,就很厉害了


最后再送大家一本,帮助大家拿到 BAT 等一线大厂 offer 的数据结构刷题笔记,是谷歌和阿里的大佬写的,对于算法薄弱或者需要提高的同学都十分受用(提取码:9go2 ):

谷歌和阿里大佬的Leetcode刷题笔记

以及我整理的7K+本开源电子书,总有一本可以帮到你

AI算法又整新活,去海边跳一支舞!相关推荐

  1. AI算法,又整新活!萌妹子来挑战~

    大家好,我是 Jack. 好久没出趣味 AI 的教程了,今天安排一期. 只需要一张图片或者视频,就可以生成相应的二次元"老婆". 感受一下: 放个视频,感受更强烈: GANsNRo ...

  2. 面试官又整新活,居然问我for循环用i++和++i哪个效率高?

    前几天,一个小伙伴告诉我,他在面试的时候被面试官问了这么一个问题: 在for循环中,到底应该用 i++ 还是 ++i ? 听到这,我感觉这面试官确实有点不按套路出牌了,放着好好的八股文不问,净整些幺蛾 ...

  3. 16 分钟优化 mRNA 疫苗稳定性!百度 AI 算法 LinearDesign 为新冠疫苗研发提速

    新冠病毒全球累计确诊已超过400万人,疫苗是终结疫情的关键胜负手.在所有正在研发的疫苗路径中,研发速度更快.更具潜力的mRNA疫苗作为一种新兴技术受到了国内外的重点关注.但同时,mRNA疫苗由于稳定性 ...

  4. 实录丨戴琼海:深度学习遭遇瓶颈,全脑观测启发下一代AI算法

    2020-09-03 20:03:00 目前我们还无法精细到神经元级别的观测,只能从功能层面理解大脑,但这些成果也启发了很多经典的人工智能算法,例如卷积神经网络启发自猫脑视觉感受野研究,胶囊网络启发自 ...

  5. 戴琼海:深度学习遭遇瓶颈,全脑观测启发下一代AI算法

    2020-09-03 02:24:51 作者 | 青暮.陈彩娴 编辑 | 陈彩娴 目前我们还无法精细到神经元级别的观测,只能从功能层面理解大脑,但这些成果也启发了很多经典的人工智能算法,例如卷积神经网 ...

  6. 糟糕,手机密码不保!剑桥大学新研究,用AI算法“监听”手机打字,触摸屏也中招...

    栗子 安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 触摸屏,也能出卖你的手机密码. 手机的内置麦克风,搭配AI算法,就能让输入的每一个字无处可逃. 你可能听不到,但手指每在屏幕上轻轻点一 ...

  7. Goolge新AI算法实时生成3D场景 | 可下载

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 3D模型又有新玩法,Goolge的新AI算法实时生成3D场景!对于3D.AR/VR来说,三维重建.模型 ...

  8. 人人可用的在线抠图,还是AI自动化的那种!北大校友的算法被玩出新高度

    杨净 发自 凹非寺  量子位 报道 | 公众号 QbitAI 现在人人可试可玩的图像分割来了. 在线API,只需输入图片网址,即可自动删除目标背景. 就拿今天凌晨刚夺得欧冠冠军的拜仁来试试手- 然后就 ...

  9. 想入职AI算法岗?BAT的工程师去学了这门课

    前言:第二期课程在2019年2月结课,第一期.第二期具有求职意向的同学中,目前已经有80%的同学拿到了国内外名企的AI算法岗位offer,或者国外名校的AI 硕士录取 offer.在大家的认可下,我们 ...

最新文章

  1. 关于Silverlight中多项目共享DLL文件的讨论
  2. python中采用字典建立统,Python中使用Counter进行字典创建以及key数量统计的方法...
  3. R语言使用car包的influencePlot函数将回归分析中的离群点(outlier)、杠杆(leverage)和影响(influence)的信息组合成一个高度信息量丰富的合成图
  4. 多層開發注重效率的注意點
  5. 2017西南计算机数学基础,[0838]《计算机数学基础》西南大学 2017 秋学期 计算机专业 作业题目及参考答案资料讲解.docx...
  6. Chat Ban 二分,等差数列(1300)
  7. django2.0.6 连接使用redis集群
  8. FDS (Flex Data Services)
  9. Spring Boot 集成 Druid 监控数据源
  10. TemplatePart用法说明
  11. plsql连接远程Oracle的方法
  12. 这两个小技巧,让SQL语句不仅躲了坑,还提升了1000倍
  13. 随想录(mmu的学习)
  14. 微信小程序------媒体组件(视频,音乐,图片)
  15. python 写入文件 wb_python读写文件
  16. linux下find搜索jpg格式图片,Linux文件查找命令-find
  17. 电力系统计算机辅助分析知乎,电力系统计算机辅助分析
  18. 使用FFmpeg进行摄像头视频采集
  19. 银行招考计算机专业考什么,银行笔试一般都考什么?
  20. 如何完全卸载删除Parallels Desktop Mac教程

热门文章

  1. 用.XML填充TreeView
  2. RTT设备与驱动之I2C:
  3. PAT甲级1154 Vertex Coloring :[C++题解]图论、模拟、结构体存边
  4. Leetcode224 基本加减计算器-双栈和状态转换
  5. 中大计算机研究生英语免修条件,通知|关于接受2017级理科研究生 基础英语课程免修免考申请的通知...
  6. python语言面试基础_【python面试指北】1.语言基础
  7. c4android 免root,C4Android中4.1.0版本不支持new命令,哪个版本支
  8. python魔法方法好难_一篇干货好文,轻松掌握python魔法方法
  9. 为什么 在内存中为什么 0xffff 是 -1
  10. 解决Ubuntu spyder 无法输入中文