乾明 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

GAN,又有了新“玩法”。

最近,一个能够将视频直接转化成漫画的工具,引发了很大关注。

它的效果是这样的:

Twitter上不少学者去围观,体验的效果是这样的:

有网友评价称,“漫威感”扑面而来。

效果直逼漫威?

目前,Demo已经放出,量子位以《复仇者联盟3》中的一个片段为例,测试了一下实际效果,得到了这样的一幅图。

画面看上去的确非常惊艳,但是……如果不看原视频,只看这个漫画,你知道它讲的是啥吗?

......

现在给出正确答案:

体验Demo时,可以自己上传视频,也可以选择YouTube中的视频。当然,他们也提供了一些样本视频,可以直接体验。

如上图所示,在生成Demo时,还有一些选项,能够影响生成的漫画。

这些选项分别可以控制视频中帧的选择、每一帧的提取方法、图像评估方法,以及漫画的风格迁移模型。

这基本上也呈现出了项目团队的大致思路:使用基于强化学习的关键帧提取算法,提取视频中有意义且有代表性的帧,然后对关键帧进行评估,确认主要的画面之后,再进行使用GAN进行风格迁移,形成漫画风格。

在风格迁移方面,研究团队对当前已经发表的漫画风格迁移模型进行了研究,最后基于CartoonGAN的方法,利用MS COCO数据集训练出了自己的ComixGAN模型,作为Demo中的默认模型。

上手资料齐全

这个项目,来自于波兰华沙理工大学。Demo网站提供了API接口。

GitHub上也有源代码。

当然,论文也出来了。

不过,特别吐槽的一点是,这个Demo网站不稳定到让人吐血,动不动就崩溃,有些时候直接罢工。

如果你对这个项目感兴趣,且有足够的“耐心”,下面的传送门请收好:

论文:

https://arxiv.org/abs/1812.03473

Demo地址:

https://comixify.ii.pw.edu.pl/

GitHub:

https://github.com/maciej3031/comixify

活动报名

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

视频直接变漫画!GAN又有了新玩法 | Demo+代码+论文相关推荐

  1. 百变大侦探剧本杀开启新玩法!等你一本正经胡说八“倒”

    "1234" "4321" 小时候的你有玩过这样的游戏吗? 当你一本正经的胡说八"倒"时候,童年的趣味就在游戏间.当然,正所谓"一 ...

  2. 蓝魔i11pro运行linux,不仅仅是变大了 蓝魔i11pro新玩法

    在以前,很多人都觉得平板电脑是更像是一个玩具,功能偏娱乐,不外乎打打游戏,看看电影.不过随着平板电脑的普及度提高,产品逐步多样化,我们开始习惯把更多重要的事情交给平板来完成.而且在教育.餐饮.银行甚至 ...

  3. 发布3天获推荐10w+,视频号内容出现新玩法?

    上月,腾讯发布Q3季度财报,视频号也被重点提及,广告主对其早前上线的原生信息流广告需求强劲,像首批投放的阿玛尼等品牌的广告还曾引起过不少讨论. 用户对视频号广告的关注热度高,也从侧面说明,视频号目前的 ...

  4. 在线佳能计算机,佳能相机秒变电脑摄像头 高画质直播新玩法

    原标题:佳能相机秒变电脑摄像头 高画质直播新玩法 出自蜂鸟网-器材,原文链接:https://m.fengniao.com/document/5362626.html 随着网络直播与在线视频会议的飞速 ...

  5. 小程序源码:语音变声器微信小程序-多玩法安装简单

    如标题所示这就是一款变声器小程序源码 程序支持多种音效生成,如少女,鬼畜,恐怖,萝莉等等! 另外支持本地音频文件上传变声 也支持直接录音变声 最后支持观看激励视频保存音频文件 当然啦,也是支持在线试听 ...

  6. 最美丽的花--百变魔尺-24段魔尺玩法

    最美丽的花--百变魔尺-24段魔尺玩法

  7. 直播新玩法背后的音视频技术演进

    点击上方"LiveVideoStack"关注我们 近年来,直播改变了许多行业模式,其形态在不断的演进中也逐渐丰富起来.直播在字节跳动中衍生出了KTV歌房.直播答题.互动游戏.电商拍 ...

  8. VR视频剧情线新玩法,带你体验层层“闯关式”剧情

    "告诉老默,我想吃鱼了",近日,一部反黑剧火爆朋友圈,这句话更是深入人心,狂飙凭借男主演技以及警察反黑的故事情节逐步推进,但是结局仍有很多留白,不少人也在猜测狂飙的真实结局到底是什 ...

  9. 抖音短视频矩阵系统视频发布权限调整通知?短视频矩阵系统玩法开发新思路!

    近日,想必很多小伙伴都收到了官方关于[视频发布权限即将下线]的通知,内容如下: 很多开发者也在考评,矩阵系统是否还有新的开发方向,今天小编也来分享下. 首先,视频发布权限的下线肯定多少会影响一部分客户 ...

最新文章

  1. 第28讲 | 弄懂数字货币交易平台(二)
  2. tensorrt yolov5 批量预测学习笔记
  3. 【Android 安装包优化】使用 lib7zr.a 静态库处理压缩文件 ( 交叉编译 lib7zr.a 静态库 | 安卓工程导入静态库 | 配置 CMakeLists.txt 构建脚本 )
  4. 雷林鹏分享:CSS 链接
  5. What is Proguard?
  6. poj3617Best Cow Line
  7. SAP S4HANA使用ABAP获得生产订单的状态
  8. spark 2.2 读取 Hadoop3.0 数据异常 org.apache.hadoop.hdfs.web.HftpFileSystem cannot access its superinterfa
  9. easyuefi只能在基于uefi启动的_云计算学习体系-1.1-计算机硬件基础扩展知识BIOS/UEFI/MBR/GPT...
  10. 倪光南:中国 5G 有望成为世界第一
  11. 【C】输出乘法口诀表
  12. PHP 利用CURL抓取页面内容
  13. atitit 项目硬件平台选型attilax总结4blg.docx
  14. AI大佬怼怼怼的背后,究竟暗藏哪些玄机?
  15. Java 构造函数的详解
  16. 甘超波:NLP抽离与结合
  17. open_table和opened_table的区别
  18. 基于CAN总线的汽车诊断协议--Windows上位机设计
  19. 浅谈领域驱动设计(DDD:Domain-Driven Design)
  20. 明日书苑:书法用笔挫笔、疾涩、接笔、搭锋、裹锋、平铺、筑锋、过

热门文章

  1. 为什么 ofo 彻底凉了?| 畅言
  2. 突发!5G 标准推迟三个月
  3. 面对 Google、Facebook、微软等科技巨头的围剿,夹缝中的初创企业该何去何从?...
  4. 苹果对体无完肤的 iOS 11 最后的弥补
  5. 新东方java开发待遇_新东方教师薪酬与考核曝光!拿去即用(仅供参考)
  6. STM32_GPIO口
  7. java glassfish_java - Tomcat,JBoss和Glassfish有什么区别?
  8. c语言调用子程序的方式,哪位师傅知道51单片机怎样编写子程序?C语言的。在主程序里调...
  9. python交互式帮助的进入、使用和退出_python退出交互式???
  10. python compile函数_python 内置函数 compile()