ai模型去除图像衍射光斑_业界 | GAN生成的假脸太逼真了!别怕,十招教你识别AI生成的假图像...
大数据文摘出品
编译:张秋玥、蒋宝尚
你能看出上面两张图片,哪张是真的,哪张是假的么?文摘菌是分不出来,太像了!
这种以假乱真的图片生成技术来源于一种左右互博术—生成对抗网络(GAN)。
这一概念由机器学习研究者Ian Goodfellow在2014年提出。之所以叫“生成”是因为该模型的输出为图像一类的信息,而非与输入数据相关的预测值(比如“该图像是否是根热狗”的预测);“对抗网络”则是因为该模型使用两组猫鼠游戏一般相互竞争的神经网络,就像收银员和伪造者斗智斗勇一样:一方试图欺骗另一方认为它拿的真实钞票,而另一方则试图区分钞票的真伪。
其实,最开始的那一批生成对抗网络(GAN)图像很容易就能被发现不是真实照片。
比如2014年的这些图片:
Radford等,2014,无监督代表学习与深度卷积生成对抗网络(也被缩写为DCGAN)
但2017年10月发布的最新GAN生成图像就不那么好区分了:
Karras等,2017,改进质量、稳定性与变化程度的GAN网络(也被缩写为PGAN或ProGAN)
如何识别出GAN生成的图像?应该着重强调面部的问题,因为绝大多数研究者们都是使用人脸图像来进行试验的,并且许多人脸图像中会出现的问题经常也会在其他类型图像中出现。
以下是识别虚假图像的几个要点:
看似画笔涂上的直发
长发很容易出现这种超级直的效果——只有一小把的话看起来其实还挺好的,但一大把直发看起来就像是有人用画刀或者大笔刷涂了一把丙烯酸颜料上去一样。
难以辨认的文字
训练于生成人脸的GAN模型不太能够抓住背景中的复杂结构。此外,GAN模型同时显示训练数据的原始与镜像版本,这意味着他们不太能够抓住文字的特征因为它一般只在单一方向出现。
超现实风格背景
GAN模型生成人脸很可信的一个原因就是,所有的训练数据都被归一化了。这意味着,当涉及到例如眼睛与耳朵的位置与渲染问题时,GAN模型的可变度会很小。另一方面,背景则可以包含任何内容了。对于GAN模型来说,模拟出一个像样的背景实在有些过分了——他们最终一般就复制出一般性的纹理样背景,而非“真实”场景。
不对称性
GAN模型有时很难处理图像中的长距离依赖性。尽管在训练数据中耳环一类的配饰通常都是成对出现,生成图像中通常并非如此。还有这种情况:人眼通常看向同一方向并呈现相同颜色,但生成图像中的眼睛经常是对对眼,还可以是异瞳色呢。高度或大小非常不匹配的耳朵也是一种常见的不对称性。
奇怪的牙齿
GAN模型能够胜任生成一般性的场景,但目前为止它还不太能够搞定半规则重复细节问题,比如牙齿。有时GAN模型会产生错位牙齿,或者以很奇怪的方式拉伸或收缩单个牙齿。这个问题在其他领域也出现过,比如砖类图像的纹理合成问题。
凌乱的头发
这是识别GAN生成图像最快方法之一。通常情况下,GAN会让头发看起来盘曲打结,在肩膀周围随机形成一缕一缕的发束,并在额头上留下厚厚的杂散毛发。发型可以非常多变,还可以拥有许多细节,因此它是最难以用GAN捕捉的特征之一。非毛发类物体有时甚至可以被变成头发状纹理。
安能辨我是雄雌
这个GAN模型是在CelebA数据集的一个子集上训练的,其中包含约一万个名人的20万张人脸图像。在这个数据集中,我没有见到有谁有面部毛发,耳环或者化妆;但GAN模型还是经常分不清不同性别特征。更一般地说,我觉得这是因为GAN模型并不总是学习人类社会所强调的二元论(比如这里的“非男即女”)。
半规则噪声
有些本应当为单色的区域可能会出现具有水平或垂直条带的半规则噪声。在本例中,可能是因为模型在试图模仿布料的质地。旧一点的GAN模型一般噪声模式更明显,我们称之为“棋盘效应”(Checkerboard Artifacts)。
棋盘效应:
https://distill.pub/2016/deconv-checkerboard/
染色问题
一些颜色较浅并且为纯色的区域可能会出现多色调染色问题,比如衣领、脖子与眼白(未在本例出现)。
真实图像的例子
看看这些清晰的背景文字,对称的耳环,大小相同的牙齿以及细节丰富的发型。学习完以上这些小技巧后你可以试试玩一些小游戏,来看你是不是真的能够区分真假图片啦。
游戏:http://nikola.mit.edu/experiment
相关报道:
https://medium.com/@kcimc/how-to-recognize-fake-ai-generated-images-4d1f6f9a2842
ai模型去除图像衍射光斑_业界 | GAN生成的假脸太逼真了!别怕,十招教你识别AI生成的假图像...相关推荐
- ai模型去除图像衍射光斑_GAN生成的假脸太逼真了!别怕,十招教你识别AI生成的假图像...
你能看出上面两张图片,哪张是真的,哪张是假的么?文摘菌是分不出来,太像了! 这种以假乱真的图片生成技术来源于一种左右互博术-生成对抗网络(GAN). 这一概念由机器学习研究者Ian Goodfello ...
- ai模型去除图像衍射光斑_生命的智慧:奥林巴斯率先开启显微镜的AI人工智能时代...
原标题:生命的智慧:奥林巴斯率先开启显微镜的AI人工智能时代 早在十七世纪,人们便发明了显微镜这一重要的科研设备,并依靠着显微镜发现微观世界的丰富多彩,与此同时显微镜也带动了科学研究的飞速发展.如今, ...
- 文档过期打不开怎么办_网络上下载文档,常见的3个问题,一招教你快速解决!...
在工作中因为不同的工作需求,所以会去网络上下载一些素材文档,大多都是Word形式,当时很多朋友表示下载后的文档却打不开,这是为什么?今天就给大家分享一下网络上下载文档常见的3个问题! 1.文档无法打开 ...
- winform checkbox要点击两次_这个Winform的UI库也太全了!四十多个控件都在这一个项目里了...
之前 Gitee 为大家介绍过几款优质的 Winform 项目:这几个WinForm项目,让你更熟悉 .NET|Gitee 项目推荐,发现Winform在大家心中的地位还是挺高的,那么今天就再给各位分 ...
- 桌面消息提醒_手机消息总是延迟,真的是网速不行?3招教你找出捣鬼设置
手机消息总是延迟,真的是网速不行?3招教你找出"捣鬼"设置 不知道大家有没有发现,我们在聊天的时候,不管用微信还是其他社交应用时,总会出现消息延迟的情况. 这些延迟的消息可能实在几 ...
- js配置打印机属性_你还在为如何设置打印机而烦恼吗?一招教你快速共享打印机!...
讲解一下共享打印的意思,共享打印是指打印机通过数据线连接某一台电脑(主机)设置共享后,局域网中的其他电脑(客户机)就可以使用此打印机.共享打印和共享文件其实是相同,都是Windows系统提供的一项服务 ...
- 录音文件下载_录音内容如何导出?对于小白来说是难题,一招教你搞定它
随着便携设备的普及,日常生活中使用到录音功能的情况越来越多.而在拥有录音功能的设备当中,使用录音软件即可实现录音的手机已经成为主流.基于录音文件的特殊格式,很多小伙伴不知道如何将录音文件导出,本期文章 ...
- 药盒识别/垃圾分类—高精度AI模型训练及边缘部署分享
这是AI应用的时代. 工厂:高速照相机拍下传送带上的零部件,机器识别出有缺陷的零件剔除: 农场:拍摄虫体照片,识别害虫名称和数量并能防控虫害,减少农药使用量,发展绿色农业 小区:智能垃圾箱可以基于图像 ...
- 从眼中窥视:Google AI 模型如何通过眼睛预测你的年龄
新的模型可以通过分析眼部照片揭示衰老的秘密 近年来,谷歌一直在研究各种人工智能模型,可以分析眼睛(内部和外部)的图像并监测某些参数.正如之前提到的,开发能够从眼睛中提取信息的 AI 模型意味着能够以经 ...
最新文章
- 微信小程序asp服务器架设,asp写的微信小程序支付demo-服务器端是asp+mdb的
- 在项目中代替DevExpress(一)
- PHP 更高效的字符长度判断方法(转)
- What happens when clicking interaction record work center?
- VC6 + OpenCV1.0实现图片缩放显示
- Windows 7 仅是Windows Vista SP2?
- sql server 2005 几个常用的存储过程或函数
- 数字 三位一节(逗号隔开)表示
- 多处理器系统下的伪共享(false sharing)问题
- hashmap允许null键和值吗_【29期】Java集合框架 10 连问,你有被问过吗?
- Linux 常用命令 tar 打包文件夹
- JSP文件的中文在浏览器上显示乱码解决方法
- c语言一些简单的程序
- 【毕设】requests+bs4+re 爬取知网文献来源的信息
- 网络摄像机进行互联网视频直播录像方案的选择,EasyNVS or EasyCloud or EasyGBS?
- python求圆柱体的体积_面向对象的Python程序计算球体的体积和表面积
- android 地图侧滑栏,Android封装侧滑菜单栏
- 使用gulp构建一个项目
- CSS设置原生table表格边框样式(添加表格横线)(附最后表格td画斜线)
- STM32F407ZGT6最小系统原理图和PCB