2020-04-29 22:09:41

作者 | 马超

出品 | CSDN(ID:CSDNnews)

基于自编码技术的AI换脸项目ALAE成功登顶了Github趋势榜(https://github.com/podgorskiy/ALAE):

相比于之前的人脸图像处理的项目,ALAE可谓是大BOSS的级别了,随便贴几张效果图大家来感受一下。

不但图像分辨甩之前几代的换脸模型几条街,学习过程的可视化也更强:

截至笔者发稿时,ALAE有两个自编码器:一个是基于MLP编码器,另一个基于StyleGAN对抗神经网络的生成模型,也可以称之为StyleALAE。ALAE的作者们将这两种体系结构的结合。结果表明,StyleALAE在各方面的性能都优于上一代的StyleGAN,且在相同分辨率下还可以生成更真实的人脸重构信息。

笔者初步在GitHub上看了一下,由那个大名鼎鼎的换脸应用Deepfaks衍生的如faceswap,DeepFaceLab的开源项目数量不下十几个,其中以faceswap、Openfaceswap等开源项目为代码的换脸技术在GitHub上的更新与讨论十分热烈,推动了开源换脸技术的迭代速度。

以FaceApp为代表的项目虽然没有开源,但是它们提供了支持一键式操作的应用程序,极大地降低了换脸技术的使用门槛。

笔者在嘘!我看到了你 60 岁的样子!一文中回顾下AI换脸技术的发展历程:

Pix2Pix:AI换脸的祖师级模型

刚刚提到如deepfaks的换脸应用,是参考了Pix2Pix的思想。Pix2Pix是基于对抗神经网络GAN的模型,其目标是由图像的轮廓,还原回真实图像,目前读者可以到https://affinelayer.com/pixsrv/这个网站来感受一下,如何从随便画出的简笔画转换成真实的图像。

后来N厂又提出了Pix2PixHD技术,Pix2PixHD把之前由Pix2Pix生成的图像分辨率提高了很多。可以说PIX2PIX是后面这些AI换脸等技术的理论基础,正是凭借AI强大的联想及脑补能力使以上应用成为了可能。

CycleGAN:风云变色的模型

2017年,加州大学伯克利分校的教授提出了CycleGAN模型,CycleGAN使用循环一致性损失函数来实现训练,来完成将图片中一个域到另一个域的无缝转换。简单来说CycleGAN能将图像的主题风格或者某一域主体完美进行切换,具体效果如下:

斑马与马的互转

CycleGAN有升级版的UGATIT,其效果更好,可以用在卡通风格的转换:

CycleGAN出现后,图像主题无缝切换将图像伪造技术提升了一个高度,在换脸之余还能把原背景主题进行切换,给鉴定带来麻烦。

StyleGAN:ALAE先导模型

StyleGAN模型也是N厂提出的,用来计算Picure A与Picture B结合的结果,StyleGAN还支持多种结合模式,详见下表:

Style 等级

Picture A

Picture B

高等级(粗略)

所有颜色(眼睛,头发,光线)和细节面部特征来自Picture A

继承Picture B高级的面部特征,如姿势、一般的发型、脸部形状和眼镜

中等级

姿势、一般的面部形状和眼镜来自Picture A

继承Picture B中级的面部特征 ,如发型,张开/闭着的眼睛

高等级(细微)

主要面部内容来自Picture A

继承Picture B高级面部特征,如颜色方案和微观结构

其两张图像按照三种style结合的效果如下图:

AI换脸的发展趋势

目前AI换脸的相关模型除了在效果方面不断取得突破之外,也有其它方面的发展动向,具体如下:

图像修复:Partialconv模型可以通过AI对于图像进行修复,这又是一个N厂提出的模型,即使图像丢失了大面积的像素,能通过AI将损失进行修复,Partialconv也是所谓的一键”去“衣、一键”去“码之类应用的鼻祖,其效果图如下:

多媒体合成:Speech-Driven Facial Animation是一个由三星提出的使用照片加音频合成视频的模型。SDA能够仅使用人的静止图像和包含语音的音频剪辑来产生动画面部。其生成的视频不仅可以产生与音频同步的唇部动作,还可以呈现特有的面部表情,例如眨眼,眉毛等,同时能够捕捉说话者的情绪并将其反映在面部表情中。

原图如下:

SDA处理之后生成的图像,静止图像立刻活灵活现起来。

AI换脸等技术的兴起可能会让未来的身份识别及认证造成一些麻烦,如果一旦将人脸面部信息与具体的人联系起来,那么人脸信息就可能被滥用,如何研发可靠的技术来鉴定真伪?是我们开发者值得关注的地方。

AI 换脸项目 ALAE 登顶 Github,AI 换脸又升级?相关推荐

  1. python 换脸 github_AI 换脸项目 ALAE 登顶 Github,AI 换脸又升级?

    作者 | 马超 基于自编码技术的AI换脸项目ALAE成功登顶了Github趋势榜(https://github.com/podgorskiy/ALAE): 相比于之前的人脸图像处理的项目,ALAE可谓 ...

  2. 9款超赞的AI开源项目!| 本周Github精选

    来源:PaperWeekly 本文共1296字,建议阅读6分钟. 本文为你分享9款实用的AI开源项目,功能强大,值得收藏! Semantic Segmentation PyTorch #PyTorch ...

  3. 抖音AI换脸项目软件开发

    抖音AI换脸项目的软件功能可能包括以下方面:     人脸检测和识别:利用深度学习算法,实现对视频中出现的人脸的检测和识别.     脸部关键点定位:实现对人脸关键点(如眼睛.嘴巴等)的自动定位和标记 ...

  4. Python换脸术,不会AI也能get有趣有料的技术!

    「2019 Python开发者日」全日程揭晓,请扫码咨询 ↑↑↑ 作者 | 雇个城管打天下,理工男一枚.南京大学软件工程系硕士,一个还在做着拥有十万读者梦的互联网新人,或许一篇文章无法获得你的关注,但 ...

  5. 从换脸到换姿势,AI 在图像处理的道路上越走越魔幻

    从换脸到换姿势,AI 在图像处理的道路上越走越魔幻 https://www.cnblogs.com/DicksonJYL/p/9569317.html [导读]加州大学伯克利分校的研究人员,近日在著名 ...

  6. 本周 Github 精选:多款超赞 AI 开源项目,等你来 Star!

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  7. Github 最新 AI 开源项目了解一下?

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  8. 精品收藏:GitHub人工智能AI开源项目

    精品收藏:GitHub人工智能AI开源项目 绝对精品!!!花了点时间,鄙人把这几年收藏的开源精品项目,整理一下,方面以后查找.其中涵盖了姿态检测,图像分割,图像分类,美学评价.人脸识别.多尺度训练,移 ...

  9. AI绘画,AI绘画小程序软件,AI换脸,AI人工智能绘画

    AI绘画,AI绘画小程序软件,AI换脸,AI人工智能绘画 可前往微信小程序进行体验:AI创意空间 AI创意主流人工智能绘画平台_语言转插画_众多绘画风格,ai绘画激发无限灵感创意,丰富图片细节 此小程 ...

最新文章

  1. (转) SolrCloud之分布式索引及与Zookeeper的集成
  2. TiDB 官方设计文档翻译(二)
  3. 金融系统 mysql,mysql - 适用于CRM,CMS和其他金融系统的RDBMS与NoSQL [已结束]
  4. 分享一份60页的《Python数据分析入门PPT》
  5. Python之路番外(第二篇):PYTHON基本数据类型和小知识点
  6. 关于Kafka高性能的几个问题
  7. DOM—外部插入.after()、.before()、.insertAfter()和.insertBefore()与内部插入.prepend()和.prependTo()...
  8. 【更新】iWebOffice2009全文批注 V10.8发布 | 附下载
  9. java中的前加加 和 后加加
  10. “磁碟机”病毒分析报告
  11. 命令top动态监控进程所占系统资源
  12. Spring_Ioc基本配置使用(基于xml)
  13. landsat7数据预处理
  14. 强化学习相关论文阅读笔记之稀疏奖励解决方法
  15. 弘辽科技:淘宝直通车显示排查下架是什么?还能推广吗?
  16. nmon下载及使用方法
  17. 《手把手教你学嵌入式无人机》——入门航模遥控器使用(MC6C)
  18. 雨果奖得主刘慈欣(《三体》作者)如何看待人工智能?
  19. 【java毕业设计】基于java+swing的模拟写字板设计与实现(毕业论文+程序源码)——模拟写字板
  20. AE 动效工作流技巧 —— 减少 Bodymovin 导出的 JSON 大小并提升性能(四)

热门文章

  1. 弹性方法计算内力例题_长江大学土木工程专业2008年钢筋混凝土楼盖课程设计案例...
  2. 计算机网络------客户-服务器方式、对等方式
  3. 基于Unity3D引擎制作大地图
  4. 高密度布线解决方案——MPO光纤连接器/跳线
  5. php做一个学生管理系统,基于php技术的学生管理系统实现方法
  6. 旧瓶装新酒:金融科技是互联网金融的避风港吗?
  7. net start mysql 遇到 MySql 服务正在启动 MySql 服务无法启动 服务没有报告任何错误 解决方式
  8. 云职教课堂计算机文化基础,智慧职教mooc学院计算机文化基础答案
  9. mysql创建表设置自增_mysql 创建表并设置主键自增
  10. android仿小米运动,GitHub - luciferldy/Bnimation: 模仿即刻 App 点赞与数字跳动效果,模仿小米运动首页转圈圈的烟花效果...