昨天上市即破发的小米,今天上午股价大涨近10%。这下雷军要笑了。

而且可以笑得更灿烂。更灿烂是什么样?来,我们用OpenAI刚刚发布的人工智能技术,给大家展示一下。





当然这个最新的技术,不止这点本事。它的“想象力”很强大的说~

比如,留胡子的硬汉版雷布斯什么样?

以及,娘化的雷布斯又是什么样?

还有。

OpenAI这个称作Glow的生成模型,不仅能像上面这样自动处理高清图片,而且还能把两个人的照片MIX一下。

说到MIX,还是以小米举例吧。

想象一下,碧昂丝和雷布斯如果有后代的话,会是什么样?把他俩照片放在一起,MIX一下……结果如下图所示。而且还可以调整父母的影像力,比方如1/4碧昂丝+3/4雷军……





好像……毫无违和感。

而且,这个新技术还放出了可用的Demo,如果你也想试试变脸或者合成照片,可以前往OpenAI官网,传送门在此:

https://blog.openai.com/glow/

Glow:另辟蹊径

上面讲的就是OpenAI发布的新技术Glow,一个AI通过观察原始图片,学会如何根据不同的属性,生成全新的高清图片。

更厉害的是,这个生成模型,既不是基于大火的对抗生成网络GAN,也不是变分自编码器VAE。

Glow是一种可逆的生成模型,也称为基于流的生成模型,它源于对NICE和RealNVP技术的扩展。与GAN和VAE两大流派相比,基于流的生成模型迄今为止在研究界很少受到关注。

NICE的论文最早发布于2014年,作者是来自蒙特利尔大学的Laurent Dinh、David Krueger、Yoshua Bengio。

传送门:https://arxiv.org/abs/1410.8516

RealNVP的论文最早发布于2016年,作者是蒙特利尔大学的Laurent Dinh以及谷歌大脑的Jascha Sohl-Dickstein、Samy Bengio。

传送门:https://arxiv.org/pdf/1605.08803.pdf

基于流的生成模型,有几个优点,例如:精确的潜变量推断和对数似然评估、可同时处理高效的推理和有效的合成、下游任务可用的潜在空间、显著节省内存空间等。

而且这种生成模型,并不限于图像处理,在语音合成、文本分析与合成、半监督学习和基于模型的控制等领域皆可应用。

开头演示的那些可调整属性,都不是预先标记好喂给神经网络的。朝怎样的方向变化,会产生发色啊,胡须量啊,诸如此类的改变,都是AI自己在潜在空间里面学到的。

OpenAI披露的信息显示,Glow模型在一块NVIDIA 1080 Ti GPU上生成256×256的样本,需要130ms。

这次的变脸,更流畅

为了让图像发生更流畅的变化,团队以Dinh等人2016年的研究为基础,提出了一种新的生成流 (Generative Flow) ,叫做Glow:





每一步 (绿框) ,都要从一个actnorm步骤开始,把激活神经元归一化 (Activation Normalization) 。

紧跟着,是一个可逆的1x1卷积,输入和输出通道数量一样多。

再往后,是一层仿射变换(Affine Transformation) 。Dinh团队提出的可逆转换,很强大,在这里被沿用了。

这三步组成一个绿框,无数的绿框连在一起,就有了周而复始的生成流。





然后,把这个流,跟右边的多尺度 (Multi-Scale) 架构结合在一起。

潺潺流淌,人脸就可以在神经网络里,发生安静又自然的变化了。

是AI自己找到的方向

在模型的训练数据上,研究人员没有手动添加任何标记。

AI会在潜在空间里,掌握各种各样的变化规律。

不论是把光滑的下颌变得胡子拉碴,还是为起气色红润的面孔完成卸妆。

没有地图,所有的方向,AI都要自己找到。

幸好,它没有迷路。

变成不一样的自己

不管是发色,面色,还是表情,这些语义特征AI或许并不懂,但这并不妨碍它实现这些属性的变化。

用编码器给图像编码,为有胡子和没胡子的样子,分别算出一个潜在向量。

两个向量之间,相差的那个向量,就是调整胡子浓密程度的滑块了。

变成别人

用编码器,给两张不同人类的照片编码。可以产生二者之间的变换过程,很完整。

从换脸途中任取一张图,就能看到两个人的基因,和解之后的样子了。

除了肉眼可辨的效果之外,团队还对比了Glow和前辈RealNVP (来自2016年的Dinh实验室) ,处理数据集时的成绩——

结果是,在5个数据集里,这只闪闪发光的模型,表现都要优于RealNVP。完成相同的任务,Glow需要的数据量更少。

青出于蓝。

选择跟随Dinh的脚步,是因为OpenAI团队看到了可逆生成模型的优点。

它跟VAE不同,跟GAN也不同,潜变量 (Latent Variable) 有了确切的推断,不只是一个近似值了。

另外,可以给数据,生成确切的对数似然值(Log-Likelyhood) ,不只是一个下限了。

总而言之,这样的模型比起前辈们,拥有更多确定的答案。

论文+代码





Glow的作者是来自OpenAI的两位:Diederik P. Kingma、Prafulla Dhariwal。而且OpenAI这次一口气放出了Glow的论文以及代码。

论文传送门:

https://d4mucfpksywv.cloudfront.net/research-covers/glow/paper/glow.pdf

代码传送门:

https://github.com/openai/glow

原文:http://tech.ifeng.com/a/20180710/45056935_0.shtml

高清变脸更快更逼真!比GAN更具潜力的可逆生成模型来了 | OpenAI论文+代码相关推荐

  1. 【转】暴风影音播放MKV高清电影一快进就卡死的问题

    转自:http://softbbs.pconline.com.cn/11315951.html 用过多个软件,KMP,完美解码,终极解码,但是设置太复杂,云里雾里,最终还是用回暴风影音. 关于MKV快 ...

  2. 狄仁杰之神都龙王 高清版 这么快就出来了

    狄仁杰之神都龙王 高清版 影片类型:动作片 影片主演:赵又廷 冯绍峰 杨颖 刘嘉玲 林更新 胡东 影片导演:未录入 出产地区:大陆上映时间:2013 对白语言:国语更新时间:2013-10-09 观看 ...

  3. 超越GAN?OpenAI提出可逆生成模型Glow!图像生成太逼真

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 作者:Aryansh Omray,微软数据科学工程师,Medium技术博主 机器学习领域的一个基本问题就是如 ...

  4. HDbaseT 高清传输更简单——只需一根网线

    HDbaseT支持最高20Gbps的传输速率,能更好的支持未来的3D和2K×4K视频格式,传输采用普通的CAT5e/6网络线缆,连接器也采用普通的 RJ45接头,而传输距离达到了100米,除了提供视频 ...

  5. 仅用18天,英伟达新型GAN合成真假难辨高清明星脸

    安妮 编译整理 量子位 出品 | 公众号 QbitAI 考眼力:你能分出下面哪张图是电脑合成的吗? 是这位神似年轻时莱昂纳多的神秘男子-- 还是这位卷发碧瞳女士-- 难以分辨. 但事实是,上面两张均为 ...

  6. 超越Swin Transformer!谷歌提出了收敛更快、鲁棒性更强、性能更强的NesT

    [导读]谷歌&罗格斯大学的研究员对ViT领域的分层结构设计进行了反思与探索,提出了一种简单的结构NesT,方法凭借68M参数取得了超越Swin Transformer的性能. 文章链接:htt ...

  7. Transformer又来搞事情!百万像素高清图轻松合成,效果迷人

    作者 | 青暮.陈大鑫 编辑 | 青暮 你上一次听到用Transformer生成图像,应该还是iGPT刚问世的时候吧?当时OpenAI用GPT-2来分类和补全图像,取得了令人惊艳的成果.遗憾在于,iG ...

  8. B站开源自研动漫超分辨率模型,助力动漫UGC视频高清化

    点击上方"LiveVideoStack"关注我们 人类对于视频画质的升级是一个永无止尽的过程.从马赛克到高清画质,从720P到4K,视频平台正在不断提升画质,但目前各大视频平台的超 ...

  9. 经典动漫秒变高清,需要怎么做?

    你的记忆中是否也有一部经典的动漫.动画片.那是我们童年的美好记忆,但是我们现在如果再去重温时往往会因为太模糊而看不下去,那么我们有什么好的办法可以修复动漫的清晰度呢?一起来看看吧! 不管是修复动画片, ...

最新文章

  1. 手机号和邮箱正则匹配
  2. 线性筛选素数法(O(n)复杂度)
  3. Algorithm Master Road:算法的时间/空间复杂度
  4. 20165310_获奖感想与Java阶段性学习总结
  5. clickhouse注入的利用
  6. Activiti用户指南之Activiti的API
  7. 将linux用在开发环境中
  8. 转结构体_小型四轮山地自行车的设计机械结构设计模具数控工艺夹具
  9. vb.net 如何连接Access数据库
  10. [来自软件No1]XP Skin Pack系统主题-把windows 7变回xp的模样
  11. 通过工具XShell4生成密钥对(公钥和私钥)
  12. JavawebJAVAJSP网吧计费管理系统(JSP网吧管理系统)网吧收费管理系统网吧自动计费管理系统
  13. VMware Workstation Server 服务器启动报1075错误
  14. php集成paypal付款流程,PHP整合PayPal支付_PHP教程
  15. 猎头猎取人才会注重人才的哪些点?
  16. 服务器存储光模块需要同型号吗,最全面的光模块系列分类讲解
  17. 2015年3月31日通过VMware VCP 认证
  18. 一套靠谱的外贸型服装鞋业系统长啥样?
  19. 离散数学考前复习:(四)关系
  20. 陪玩视频聊天系统开发,升级与更新功能的实现

热门文章

  1. Linux 段错误详解
  2. android java 时间测试方法_一个让你开挂的Android 性能测试方法
  3. Java 使用匿名内部类在方法内部定义并启动线程
  4. 算法 - 堆排序(C#)
  5. mysql查询时间between and_Mysql中用between...and...查询日期时注意事项
  6. db2 日期英式写法_《学霸英语》16:美国人和英国人“表达日期”,差距竟然这么大!...
  7. python sanic部署_Sanic框架配置操作分析
  8. php根据城市获取天气预报,根据浏览者ip获取城市,然后在获取城市天气预报
  9. uos连接服务器共享文件夹,使用UOS系统共享文件给其他设备的的办法
  10. 在研究所工作是什么体验?和互联网公司比,你会怎么选?