视学算法报道

转载自:机器之心

编辑:张倩

「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女。」

春节档上映的《你好,李焕英》让不少人在影院哭得稀里哗啦,它戳中了每个人心里最柔软的部分。有人看完电影之后会给妈妈打个电话,有人会拿出妈妈年轻时的照片,感叹一下爸爸的基因为什么要那么强大。

B 站知名 up 主大谷也是《你好,李焕英》的影迷之一,不过他做了一点不一样的事情:尝试用一系列 AI 技术修复了李焕英年轻时的黑白照片,不仅给照片上了色、提高了分辨率,还让照片中的人物动了起来。

原始黑白照片。

修复后的动态彩色照片。

整个修复的流程并不复杂,涉及 AI 色彩还原、AI 清晰度增强、脸部精修、手绘微调等过程:

最终的修复效果如下:

大谷表示,他是偶然间看到了这张老照片,很有感触,于是试着用 AI 脑补还原了一下拍摄前的动态影像。不过,由于还原场景动态与上色是基于 AI 技术生成,具有一定的想象元素,因此不等于准确还原。

为了帮助大家掌握这项技能,大谷还公布了他用到的两个开源项目:飞桨 PaddleGAN 和 DFDNet。

飞桨 PaddleGAN

GAN 的全称是生成对抗网络,被「卷积网络之父」Yann LeCun(杨立昆)誉为「过去十年计算机科学领域最有趣的想法之一」,是近年来火遍全网、AI 研究者最为关注的深度学习算法方向之一。

GAN 在诸多领域都有着成功的应用,如图像生成 / 修复、超分辨率、图像噪声消除、换装 / 妆、图像风格迁移、文字 / 声音生成等,覆盖互联网、娱乐、游戏等各个行业。

为了给开发者提供经典及前沿的生成对抗网络高性能实现,并支撑开发者快速构建、训练及部署生成对抗网络,百度飞桨打造了一个图像生成模型库——PaddleGAN,覆盖 Pixel2Pixel、CycleGAN、StyleGAN2、PSGAN 等经典 GAN 模型,支持视频插帧、超分辨率、老照片 / 视频上色、视频动作生成等应用。

除了上面展示的视频修复,PaddleGAN 还能提供各类不同的图形影像生成、处理能力。人脸属性编辑能力能够在人脸识别和人脸生成基础上,操纵面部图像的单个或多个属性,实现换妆、变老、变年轻、变换性别、发色等,使得一键换脸成为可能 *;* 动作迁移能够实现肢体动作变换、人脸表情动作迁移等。

比如这样:

让苏大强表达心中之痛,唱起 unravel(视频链接:https://www.bilibili.com/video/BV1Yy4y1r7DC)。

这样:

还有这样:

PaddleGAN 项目链接:https://github.com/PaddlePaddle/PaddleGAN/blob/develop/README_cn.md

DFDNet

近年来,基于参考的人脸修复方法已经受到了很多关注,但这些方法大多需要来自相同身份的高质量的参考图像,因此只适用于有限的场景。为了解决这一问题,来自哈尔滨工业大学、香港大学等机构的研究者在《Blind Face Restoration via Deep Multi-scale Component Dictionaries》一文中提出了一种名为深度人脸字典网络(deep face dictionary network,DFDNet)的方法来指导退化观测(dgraded observation 的修复过程。

首先,作者使用 K-means,利用高质量图像为感知显著的人脸部位(如左 / 右眼、鼻子和嘴)生成深度字典。接下来,利用退化输入(degraded input),研究者从相应的字典中匹配和选择最相似的部位特征,并通过提出的字典特征迁移块(DFT)将高质量的细节迁移到输入上。最后,利用多尺度字典逐步实现从粗粒度到细粒度的修复。

实验结果表明,作者提出的方法在定性和定量评估中都能实现合理的性能。更加重要的是,该方法可以在不需要 identity-belonging 参考的情况下,利用真实的退化图像(degraded image)生成逼真、有前景的结果。以下是一些人脸修复效果展示:

该网络的基本结构如下:

网络主要包含两个部分:a. 从大量包含各种姿态和表情的高质量图像中离线生成多尺度组件字典。这部分使用 K-means 算法为每个部位(即左 / 右眼、鼻子和嘴)在不同尺度上生成 K 个簇;b. 修复过程和字典特征迁移(DFT)块,用于以渐进的方式提供参考细节。

  • 论文链接:https://arxiv.org/pdf/2008.00418.pdf

  • 项目链接:https://github.com/csxmli2016/DFDNet

参考链接:

https://mp.weixin.qq.com/s/xSic1Tk93dk_N1qMylymtg

https://www.bilibili.com/video/BV1wh411k7YN?p=1&share_medium=iphone&share_plat=ios&share_source=WEIXIN_MONMENT&share_tag=s_i×tamp=1613972331&unique_k=KQGwoS 

© THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

点个在看 paper不断!

用AI还原李焕英老照片动态影像相关推荐

  1. 用技术致敬每一位妈妈,B站up主用AI还原李焕英老照片动态影像

    公众号 "菜鸟学Python" 设为 "星标",一起学Python! 转自:机器之心 「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女. ...

  2. B站up主用AI还原李焕英 动态影像

    「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女.」 春节档上映的<你好,李焕英>让不少人在影院哭得稀里哗啦,它戳中了每个人心里最柔软的部分.有人看完电影之后会给妈 ...

  3. 动态“神还原”李焕英旧照,用技术致敬每一位妈妈!

    来自|机器之心   编辑|张倩 「从我有记忆开始,妈妈就是中年妇女的模样,所以我会忘记,她也曾是花季少女.」 春节档上映的<你好,李焕英>让不少人在影院哭得稀里哗啦,它戳中了每个人心里最柔 ...

  4. 李焕英 照片动起来了?B站 up主用AI还原动态影像

    参考链接:https://mp.weixin.qq.com/s/xSic1Tk93dk_N1qMylymtghttps://www.bilibili.com/video/BV1wh411k7YN?p= ...

  5. 你好,这是微视AI还原的李焕英

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 看,李焕英这亲切的笑容.明亮的眼眸,是否与银幕上那个她一样有感染力? 你的长辈年轻时,又是否像这张老照片里的人一样,剑眉星目,神采飞扬: 要 ...

  6. 火爆全网的《李焕英》通过 AI 还原“复活”了

    春节期间<你好李焕英>电影以 42 亿票房,火遍全球,赚足了我们的眼泪,各位宝宝们都默默在心里保证:我一定要听妈妈的话两天,哦不,一周.<(罒 ω 罒)> <你好,李焕英 ...

  7. 后起之秀,《你好,李焕英》,票房已过十个亿和唐探三哪个好?

    两部电影我都看过了,说一说我的感受! <唐人街探案3>凭借着1和2积攒下来的的口碑,从预售开始就一骑绝尘,抢走了6成票房.我最先选择看的就是这部电影,也是冲着1和2的惊艳去的!但是看完电影 ...

  8. “李焕英效应”将长期主宰中国影视股投资逻辑

    来源|锦缎 编辑|新月 代表匠心精神的古人说"酒香不怕巷子深",推崇营销包装的今人又说"酒香也怕巷子深". 而当前整个文娱产业,已经进入"没有深巷,只 ...

  9. 今天,我们用爱把“李焕英”带回了 2021......

    春节档电影<你好,李焕英>大火,截至目前实时总票房已突破 50 亿.这部电影除了为亿万观众带去了欢声笑语外,正如这部电影的译名<HI,MOM>所表达,大家也被影片中真挚的母女情 ...

最新文章

  1. Windows 7 部署(一):安装和部署简述
  2. 我有一个很好的思维习惯-反思
  3. (视频+图文)机器学习入门系列-第2章 线性回归
  4. Hadoop处理HDF文件
  5. Good, then we can start
  6. 浏览器检测 vs 特性检测
  7. Java解析XML并自动写入Excel
  8. [4G+5G专题-145]: 一体化小基站- 5G小基站软件建议架构概述
  9. Linux软件安装包保存
  10. android 取imei p10,纯干货 | 一般人不知道的几个华为P10小技巧
  11. 纺织企业举步维艰,小微纺织企业该如何做?
  12. 第12章 Stata非线性回归分析
  13. linux系统命令-查看内存使用情况
  14. 直流马达驱动_ADC_PWM加减速(STM32F4 CubeMX)
  15. HTTP 304状态码讲解
  16. 如何将 DAT 转换为 MP4
  17. 你和那些优秀的人差距在哪里?
  18. PATB1062 最简分数 辗转相除法
  19. Android产品研发(八)--App数据统计
  20. 360免费wifi v5.3.0.1035 免费版

热门文章

  1. 刻意练习:LeetCode实战 -- Task02. 删除排序数组中的重复项
  2. 如何利用神经网络结合遗传算法进行非线性函数极值寻优(2)
  3. MOG2 成员函数参数设定
  4. 全面解析 Kmeans 聚类算法(Python)
  5. 2020职场人裸辞三大原因:不开心、工资低、没有盼头
  6. 快手王华彦:端上视觉技术的极致效率及其短视频应用实践 | AI ProCon 2019
  7. 阿里AI摘图像识别竞赛WebVision桂冠,万物识别准确率创世界纪录
  8. 一根烟上热搜,先让AI看看你的肺
  9. Facebook数据丑闻后续:“罪魁”剑桥分析破产,但它还留了一手数据
  10. 中国“神威”获超算排行榜四连冠,却遭外媒质疑