AI算法又整新活,去海边跳一支舞!
大家好,我是K同学啊!
昨天逛某知名网站的时候,发现了一个有趣的算法,分享给大家
一张任意背景的图片,实现任意切换背景,感受一下:
放个视频,感受更强烈:
MODNet算法展示!
MODNet
MODNet是一个仅需RGB图片输入的实时人像抠图模型。
模型学习分为三个部分:语义估计(Semantic Estimation)、细节预测(Detail Prediction)和语义细节融合(Semantic-Detail Fusion)。
语义估计(Semantic Estimation):与现有的多模型方法类似,MODNet的第一步是在输入图像中定位人。不同之处在于,这里只能通过编码器来提取高级语义。MODNet的低分辨率分支,它有两个主要优势。首先,语义估计变得更加有效,因为它不再由包含解码器的单独模型来完成。其次,高级表示(I)有助于后续分支和联合优化。我们可以应用任意的CNN骨干toS。为了促进实时交互,我们采用了MobileNetV2[35]架构,这是一种为移动设备开发的独立模型。
细节预测(Detail Prediction):使用了高分辨率分支 D 处理前景肖像周围的过渡区域,它采用 I、S(I) 和来自 Sas 输入的低级特征。重用低级特征的目的是减少D的计算开销。此外,作者在以下三个方面进行就进一步简化:
- D包含比S更少的卷积层;
- 为D中的卷积层选择了一个小的通道数;
- 我们不保持整个D的原始输入分辨率。在实践中,D由12个卷积层组成,其最大通道数为64。特征图分辨率在第一层下采样到1/4,在后两层恢复。此设置对细节预测的影响可以忽略不计。
都想要的
- 论文地址:https://github.com/ZHKKKe/MODNet
- 项目地址:https://arxiv.org/pdf/2011.11961.pdf
如果你懒得去看论文也不想敲代码,请看下面,作者早已洞悉大家的急迫上手的心情,代码直接给我们准备好了,只需点一个「运行」按钮即可。
- 图像:https://colab.research.google.com/drive/1GANpbKT06aEFiW-Ssx0DQnnEADcXwQG6?usp=sharing
- 视频:https://colab.research.google.com/drive/1Pt3KDSc2q7WxFvekCnCLD8P0gBEbxm6J?usp=sharing
把发丝都能给扣出来,就很厉害了
最后再送大家一本,帮助大家拿到 BAT 等一线大厂 offer 的数据结构刷题笔记,是谷歌和阿里的大佬写的,对于算法薄弱或者需要提高的同学都十分受用(提取码:9go2 ):
谷歌和阿里大佬的Leetcode刷题笔记
以及我整理的7K+本开源电子书,总有一本可以帮到你
AI算法又整新活,去海边跳一支舞!相关推荐
- AI算法,又整新活!萌妹子来挑战~
大家好,我是 Jack. 好久没出趣味 AI 的教程了,今天安排一期. 只需要一张图片或者视频,就可以生成相应的二次元"老婆". 感受一下: 放个视频,感受更强烈: GANsNRo ...
- 面试官又整新活,居然问我for循环用i++和++i哪个效率高?
前几天,一个小伙伴告诉我,他在面试的时候被面试官问了这么一个问题: 在for循环中,到底应该用 i++ 还是 ++i ? 听到这,我感觉这面试官确实有点不按套路出牌了,放着好好的八股文不问,净整些幺蛾 ...
- 16 分钟优化 mRNA 疫苗稳定性!百度 AI 算法 LinearDesign 为新冠疫苗研发提速
新冠病毒全球累计确诊已超过400万人,疫苗是终结疫情的关键胜负手.在所有正在研发的疫苗路径中,研发速度更快.更具潜力的mRNA疫苗作为一种新兴技术受到了国内外的重点关注.但同时,mRNA疫苗由于稳定性 ...
- 实录丨戴琼海:深度学习遭遇瓶颈,全脑观测启发下一代AI算法
2020-09-03 20:03:00 目前我们还无法精细到神经元级别的观测,只能从功能层面理解大脑,但这些成果也启发了很多经典的人工智能算法,例如卷积神经网络启发自猫脑视觉感受野研究,胶囊网络启发自 ...
- 戴琼海:深度学习遭遇瓶颈,全脑观测启发下一代AI算法
2020-09-03 02:24:51 作者 | 青暮.陈彩娴 编辑 | 陈彩娴 目前我们还无法精细到神经元级别的观测,只能从功能层面理解大脑,但这些成果也启发了很多经典的人工智能算法,例如卷积神经网 ...
- 糟糕,手机密码不保!剑桥大学新研究,用AI算法“监听”手机打字,触摸屏也中招...
栗子 安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 触摸屏,也能出卖你的手机密码. 手机的内置麦克风,搭配AI算法,就能让输入的每一个字无处可逃. 你可能听不到,但手指每在屏幕上轻轻点一 ...
- Goolge新AI算法实时生成3D场景 | 可下载
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 3D模型又有新玩法,Goolge的新AI算法实时生成3D场景!对于3D.AR/VR来说,三维重建.模型 ...
- 人人可用的在线抠图,还是AI自动化的那种!北大校友的算法被玩出新高度
杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI 现在人人可试可玩的图像分割来了. 在线API,只需输入图片网址,即可自动删除目标背景. 就拿今天凌晨刚夺得欧冠冠军的拜仁来试试手- 然后就 ...
- 想入职AI算法岗?BAT的工程师去学了这门课
前言:第二期课程在2019年2月结课,第一期.第二期具有求职意向的同学中,目前已经有80%的同学拿到了国内外名企的AI算法岗位offer,或者国外名校的AI 硕士录取 offer.在大家的认可下,我们 ...
最新文章
- 关于Silverlight中多项目共享DLL文件的讨论
- python中采用字典建立统,Python中使用Counter进行字典创建以及key数量统计的方法...
- R语言使用car包的influencePlot函数将回归分析中的离群点(outlier)、杠杆(leverage)和影响(influence)的信息组合成一个高度信息量丰富的合成图
- 多層開發注重效率的注意點
- 2017西南计算机数学基础,[0838]《计算机数学基础》西南大学 2017 秋学期 计算机专业 作业题目及参考答案资料讲解.docx...
- Chat Ban 二分,等差数列(1300)
- django2.0.6 连接使用redis集群
- FDS (Flex Data Services)
- Spring Boot 集成 Druid 监控数据源
- TemplatePart用法说明
- plsql连接远程Oracle的方法
- 这两个小技巧,让SQL语句不仅躲了坑,还提升了1000倍
- 随想录(mmu的学习)
- 微信小程序------媒体组件(视频,音乐,图片)
- python 写入文件 wb_python读写文件
- linux下find搜索jpg格式图片,Linux文件查找命令-find
- 电力系统计算机辅助分析知乎,电力系统计算机辅助分析
- 使用FFmpeg进行摄像头视频采集
- 银行招考计算机专业考什么,银行笔试一般都考什么?
- 如何完全卸载删除Parallels Desktop Mac教程
热门文章
- 用.XML填充TreeView
- RTT设备与驱动之I2C:
- PAT甲级1154 Vertex Coloring :[C++题解]图论、模拟、结构体存边
- Leetcode224 基本加减计算器-双栈和状态转换
- 中大计算机研究生英语免修条件,通知|关于接受2017级理科研究生 基础英语课程免修免考申请的通知...
- python语言面试基础_【python面试指北】1.语言基础
- c4android 免root,C4Android中4.1.0版本不支持new命令,哪个版本支
- python魔法方法好难_一篇干货好文,轻松掌握python魔法方法
- 为什么 在内存中为什么 0xffff 是 -1
- 解决Ubuntu spyder 无法输入中文