夏乙 伊瓢 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

斯坦福两名学生Mark Sabini和Gili Rusak,在CS230的期末作业里把图像补到了取景框外边。

就像这样:



原本像手机拍摄的照片一样小的一幅画,一下子变成了开阔的大图。

机器根据它天才的“脑补力”,将白天和傍晚的竖幅海景图脑补出左右两侧的样子还原出了方形海景图照片。看上去除了左右两侧有种照片被水泡了的模糊感之外,就是完整的一张照片。

Keras实现

最近,印度班加罗尔一位小哥Bendangnuksung(简称Bendang)看中了这种算法,决定把它发扬光大。于是,他根据论文中的训练方法,打造了一个超低门槛的Keras实现,还把可处理的分辨率从128×128提升到了256×256。

一经推出,在Reddit上引起轰动。

大家纷纷表示过于厉害了:

你该不会是用训练集做的测试吧?

牛逼,喜欢这种很实用的东西。

效果太好了,简直不像是真的。

除了能看出原图和生成内容的边界之外,其他简直完美。

甚至还开脑洞想出了应用场景:

4:3画幅的电影可以无暇延伸成21:9的了!还可以把旧电影放大成4k画面!

如果我把我的半个脸给它,能给我恢复过来么?

但是也有不少网友指出了一个小问题:这个模型的训练和测试过程很不规范,Bendang展示的效果图,是训练数据中就包含的。

Bendang解释说这个Keras实现,是用海滩数据集训练的,整个数据集一共就350张图,(你们就理解一下嘛)。

然后,他也给出了一张真正的测试效果:



效果勉勉强强。

有了Keras实现,这么cool的想法确实好上手很多,不过在训练和测试这件事上,大家不要学印度小哥。

训练过程

在论文中,这个模型的用到的训练集相当大,有超过3万张图片。不过每张图片只是128×128的小图。



首先,按照这个要求准备数据库,找到36500张128×128的照片,保留100张做测试集。



处理好的数据,通过这样一个DCGAN构架训练。

后面测试集的结果如下,第一排是输入的窄图,第二排是输出效果,第三排则是这张图的原图。



比较一下第二排和第三排看出,结果还不错,除了部分图片有一些明显的边缘之外,还是可以看出图像的连续性的。另外,还有五倍宽度版:



彩蛋

这篇论文获得了CS230作业中的Outstanding Posters。在CS230的作业中,还有很多十分有趣的研究,比如说,Final Project Prize Winners第一名的作业,照着卫星图画地图。



而且,量子位悄悄LinkedIn了一下几位拿到了第一名作者,貌似都是华人/华裔学霸(亮点自寻)。



传送门

Keras实现:
https://github.com/bendangnuksung/Image-OutPainting

相关论文:

Painting Outside the Box: Image Outpainting with GANs
Mark Sabini and Gili Rusak

海报:
http://marksabini.com/files/cs230__Painting_Outside_the_Box_Image_Outpainting_with_GANs__poster.pdf

论文:
http://marksabini.com/files/cs230__Painting_Outside_the_Box_Image_Outpainting_with_GANs__report.pdf

原作者的代码:
https://github.com/ShinyCode/image-outpainting

加入社群

量子位AI社群18群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

实习生招聘

量子位正在招募活动运营实习生,策划执行AI明星公司CEO、高管等参与的线上/线下活动,有机会与AI行业大牛直接交流。工作地点在北京中关村。简历欢迎投递到quxin@qbitai.com

具体细节,请在量子位公众号(QbitAI)对话界面,回复“实习生”三个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

手机照片脑补成超大画幅,这个GAN想象力惊人 | Keras实现相关推荐

  1. vue调用手机相机相册_今天才发现,点一下小米手机相册,能将照片一键制作成电影...

    随着国产手机的发展,手机像素越来越高,里面的功能也越来越丰富,手机拍照成了不少人的日常,如果你很爱拍照,手机里有一大堆照片,那么教你用手机自带的相册功能,一键将照片制作成电影,自带背景音乐,好看还很高 ...

  2. 湖波荡漾、烟雾蒸腾……这些动态场景竟都是AI「脑补」出的

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 转自|机器之心 霍格沃兹的魔法世界,似乎离我们越来越近了. 或许是 ...

  3. 脑补慢动作的AI源代码来了:有了它,普通视频也能平滑补帧

    晓查 发自 凹非寺 量子位 出品 | 公众号 QbitAI 手机慢动作视频拍摄已经越来越普及,但网上大多数视频仍然是低帧率.如果我们自己能够自己动手,把球赛精彩瞬间转换成慢动作回放,那该有多好啊! 今 ...

  4. CVPR2022 | 只用一张图+相机走位,AI就能脑补周围环境,来自华人团队

    明敏 发自 凹非寺 量子位 | 公众号 QbitAI 站在门口看一眼,AI就能脑补出房间里面长什么样: 是不是有线上VR看房那味儿了? 不只是室内效果,来个远景长镜头航拍也是so easy: 而且渲染 ...

  5. 用「我的世界」自动生成「现实世界」:英伟达展示AI脑补新技术

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自:机器之心 Minecraft 里面自建像素风世界不够过瘾?英伟达:那就让 AI ...

  6. 【CVPR 2022】只用一张图+相机走位,AI就能脑补周围环境

    来源:量子位 站在门口看一眼,AI就能脑补出房间里面长什么样: 是不是有线上VR看房那味儿了? 不只是室内效果,来个远景长镜头航拍也是so easy: 而且渲染出的图像通通都是高保真效果,仿佛是用真相 ...

  7. “脑补”的科学依据:眼前的黑不是黑,靠得是你的大脑

    一个在眨眼的婴儿 | 图片来源:Leungcho Pan/Shutterstock 撰文:Mindy Weisberger 来源:科研圈 编译:向菲菲 人们常说:"别眨眼,精彩稍纵即逝.&q ...

  8. 只用一张图+相机走位,AI就能脑补周围环境,来自华人团队 | CVPR2022

    明敏 发自 凹非寺 量子位 | 公众号 QbitAI 站在门口看一眼,AI就能脑补出房间里面长什么样: 是不是有线上VR看房那味儿了? 不只是室内效果,来个远景长镜头航拍也是so easy: 而且渲染 ...

  9. 这年头,机器翻译都会通过文字脑补画面了 | NAACL 2021

    博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI 现在,想象一个外国人面前摆了句「金石迸碎荡尘埃,磐山纡水尽为开」. 除了痛苦地死抠复杂单词和长难句语法,他还能怎么去理解这句话呢? --想象 ...

最新文章

  1. 解决Windows 10下Wireshark运行问题
  2. Android MIPI转LVDS显示屏调试之--- SD65DSI84概述(2)
  3. 如何将mysql的数据库渲染到页面_vue.js实现数据库的JSON数据输出渲染到html页面功能示例...
  4. GOF23设计模式之单例模式
  5. UCHOME出现问题(转帖)
  6. 博主亲测Mac OSX 上好用必备的PC端软件
  7. Python自动化办公之操作Excel文件
  8. 支持向量机原理(理解SVM的三层境界)
  9. 非常好用的节假日查询接口
  10. 奥维kml文件制作工具_工具和在线制作中国象棋GIF动图文件
  11. im即时通讯开发:浅析MQTT通信协议
  12. Flask-Assets 使用autoprefixer并压缩css/JS文件提高访问速度
  13. JAVA基础核心技术总结(2)--基本语法
  14. mysql制作排行榜_mysql实现排行榜
  15. Hexo 博客快速整合公众号导流工具,不用互推也能实现粉丝躺增!
  16. [转]信息安全相关理论题(二)
  17. 开源协议有哪些?如何选择开源协议?
  18. Android视频监控实现(一)
  19. spring cloud eureka 样式没有了,wro.css wro.js 404
  20. Unity 编辑器代码打开场景

热门文章

  1. tomcat原理及作用,MySQL数据中有很多换行符和回车符
  2. 字节跳动社招面试记录,javaspring框架详细设计模板
  3. 第 23 章 解释器模式
  4. Struts结合梅花雪实现动态生成树
  5. 服务器项目部署工具,通过工具SecureCRTPortable将项目部署到服务器上
  6. think php 3.2.3 环境,ThinkPHP 3.2.3 入口文件配置
  7. impala 本年格式化时间_【DataPM】Impala里的日期函数
  8. mysql主从 dump线程_MySQL主从复制线程状态转变
  9. 请确保已载入内核模块vmmon_冒充市场监管部门短信诈骗,多人已受骗!
  10. android 多个模块,Android Studio:多个模块的多个APK