你能看出上面两张图片,哪张是真的,哪张是假的么?文摘菌是分不出来,太像了!

这种以假乱真的图片生成技术来源于一种左右互博术—生成对抗网络(GAN)。

这一概念由机器学习研究者Ian Goodfellow在2014年提出。之所以叫“生成”是因为该模型的输出为图像一类的信息,而非与输入数据相关的预测值(比如“该图像是否是根热狗”的预测);“对抗网络”则是因为该模型使用两组猫鼠游戏一般相互竞争的神经网络,就像收银员和伪造者斗智斗勇一样:一方试图欺骗另一方认为它拿的真实钞票,而另一方则试图区分钞票的真伪。

其实,最开始的那一批生成对抗网络(GAN)图像很容易就能被发现不是真实照片。

比如2014年的这些图片:

Radford等,2014,无监督代表学习与深度卷积生成对抗网络(也被缩写为DCGAN)

但2017年10月发布的最新GAN生成图像就不那么好区分了:

Karras等,2017,改进质量、稳定性与变化程度的GAN网络(也被缩写为PGAN或ProGAN)

如何识别出GAN生成的图像?应该着重强调面部的问题,因为绝大多数研究者们都是使用人脸图像来进行试验的,并且许多人脸图像中会出现的问题经常也会在其他类型图像中出现。

以下是识别虚假图像的几个要点:看似画笔涂上的直发

长发很容易出现这种超级直的效果——只有一小把的话看起来其实还挺好的,但一大把直发看起来就像是有人用画刀或者大笔刷涂了一把丙烯酸颜料上去一样。难以辨认的文字

训练于生成人脸的GAN模型不太能够抓住背景中的复杂结构。此外,GAN模型同时显示训练数据的原始与镜像版本,这意味着他们不太能够抓住文字的特征因为它一般只在单一方向出现。超现实风格背景

GAN模型生成人脸很可信的一个原因就是,所有的训练数据都被归一化了。这意味着,当涉及到例如眼睛与耳朵的位置与渲染问题时,GAN模型的可变度会很小。另一方面,背景则可以包含任何内容了。对于GAN模型来说,模拟出一个像样的背景实在有些过分了——他们最终一般就复制出一般性的纹理样背景,而非“真实”场景。不对称性

GAN模型有时很难处理图像中的长距离依赖性。尽管在训练数据中耳环一类的配饰通常都是成对出现,生成图像中通常并非如此。还有这种情况:人眼通常看向同一方向并呈现相同颜色,但生成图像中的眼睛经常是对对眼,还可以是异瞳色呢。高度或大小非常不匹配的耳朵也是一种常见的不对称性。奇怪的牙齿

GAN模型能够胜任生成一般性的场景,但目前为止它还不太能够搞定半规则重复细节问题,比如牙齿。有时GAN模型会产生错位牙齿,或者以很奇怪的方式拉伸或收缩单个牙齿。这个问题在其他领域也出现过,比如砖类图像的纹理合成问题。凌乱的头发

这是识别GAN生成图像最快方法之一。通常情况下,GAN会让头发看起来盘曲打结,在肩膀周围随机形成一缕一缕的发束,并在额头上留下厚厚的杂散毛发。发型可以非常多变,还可以拥有许多细节,因此它是最难以用GAN捕捉的特征之一。非毛发类物体有时甚至可以被变成头发状纹理。安能辨我是雄雌

这个GAN模型是在CelebA数据集的一个子集上训练的,其中包含约一万个名人的20万张人脸图像。在这个数据集中,我没有见到有谁有面部毛发,耳环或者化妆;但GAN模型还是经常分不清不同性别特征。更一般地说,我觉得这是因为GAN模型并不总是学习人类社会所强调的二元论(比如这里的“非男即女”)。半规则噪声

有些本应当为单色的区域可能会出现具有水平或垂直条带的半规则噪声。在本例中,可能是因为模型在试图模仿布料的质地。旧一点的GAN模型一般噪声模式更明显,我们称之为“棋盘效应”(Checkerboard Artifacts)。

棋盘效应:https://distill.pub/2016/deconv-checkerboard/染色问题

一些颜色较浅并且为纯色的区域可能会出现多色调染色问题,比如衣领、脖子与眼白(未在本例出现)。真实图像的例子

看看这些清晰的背景文字,对称的耳环,大小相同的牙齿以及细节丰富的发型。学习完以上这些小技巧后你可以试试玩一些小游戏,来看你是不是真的能够区分真假图片啦。

ai模型去除图像衍射光斑_GAN生成的假脸太逼真了!别怕,十招教你识别AI生成的假图像...相关推荐

  1. ai模型去除图像衍射光斑_业界 | GAN生成的假脸太逼真了!别怕,十招教你识别AI生成的假图像...

    大数据文摘出品 编译:张秋玥.蒋宝尚 你能看出上面两张图片,哪张是真的,哪张是假的么?文摘菌是分不出来,太像了! 这种以假乱真的图片生成技术来源于一种左右互博术-生成对抗网络(GAN). 这一概念由机 ...

  2. 这些假脸实在太逼真了!英伟达造出新一代GAN,生成壁纸级高清大图毫无破绽...

    栗子 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 不敢相信,上面这些人脸,全都是假的. 是英伟达的AI生成的. 借用风格迁移的思路,团队为GAN创造了一种新的生成器. 连GAN之父G ...

  3. ai模型去除图像衍射光斑_生命的智慧:奥林巴斯率先开启显微镜的AI人工智能时代...

    原标题:生命的智慧:奥林巴斯率先开启显微镜的AI人工智能时代 早在十七世纪,人们便发明了显微镜这一重要的科研设备,并依靠着显微镜发现微观世界的丰富多彩,与此同时显微镜也带动了科学研究的飞速发展.如今, ...

  4. 视频转GIF太模糊了吗?我来教你使用FFmpeg生成高清GIF!!!

    有钱能使鬼推磨,昨天40多个阅读,没有一个人给我实在是太惨了,所以,再来个第二弹吧! 那么这次的主题,就是教你如何通过视频生成高清的GIF图片!! 恩,素材就用上次的那个动态收款码吧! 使用FFmpe ...

  5. 华为云发布国内首个 AI 模型市场,加速企业 AI 应用落地

    华为云在 3 月 21 日的 2019 华为中国生态伙伴大会上,正式发布华为云 AI 市场:同时宣布投入专项激励,在 AI 市场上帮助开发者.合作伙伴加速企业的 AI 应用落地. 华为云 AI 市场是 ...

  6. Facebook新AI模型SEER实现自监督学习,LeCun大赞最有前途

    Fly-AI竞赛服务平台 flyai.com 在开始学习之前推荐大家可以多在FlyAI竞赛服务平台多参加训练和竞赛,以此来提升自己的能力.FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站 ...

  7. 大AI巧用「砌砖」方法:LLM可通过将任务「外包」给专业领域的AI模型来提高其性能...

    来源:ScienceAI 本文约1800字,建议阅读5分钟 新的研究表明,让 LLM 将工作外包给规模较小的专业 AI 可以显著扩大其范围. 大型语言模型(LLM)功能的快速改进使它们能够处理范围广泛 ...

  8. 炸金花游戏(3)--基于EV(期望收益)的简单AI模型

    前言: 炸金花这款游戏, 从技术的角度来说, 比德州差了很多. 所以他的AI模型也相对简单一些. 本文从EV(期望收益)的角度, 来尝试构建一个简单的炸金花AI. 相关文章: 德州扑克AI--Prog ...

  9. AI工具合集!一共600+覆盖全行业,除了ChatGPT,那你也会喜欢这些其他的AI工具

    如果你喜欢ChatGPT,那你也会喜欢这些其他的AI工具. AI正在改变我们的工作方式,我不想错过充分利用它的机会,所以我尝试了一系列AI工具来节省时间,提高我的工作效率. 这里有个集合了600+ai ...

最新文章

  1. Kraken:使用精确比对的超快速宏基因组序列分类软件
  2. jquery 吐司_jquery – 更改toastr通知的positionclass
  3. 数据仓库及其体系建设
  4. nssl1321,jzoj(初中)2106-买门票【dfs,暴力,字符串】
  5. HBase之HRegionServer处理put请求
  6. mysql 慢查询开启
  7. 【LeetCode】【数组】题号:*289,生命游戏
  8. 会考计算机辅助制图,信息技术会考基础知识
  9. uniapp 制作手机app程序, 使用uni.chooseVideo录制视频,视频播放模糊分辨率低的原因
  10. 计算机科学期刊是a类还是b类,期刊的A类B类C类什么意思
  11. centos7安裝搜狗輸入法_centos7安装搜狗输入法
  12. Codeforces Round #677 (Div. 3) C. Dominant Piranha
  13. Debezium的基本使用(以MySQL为例)
  14. 爱奇艺连续三年独家直播中网赛事 打造高端体育赛事生态矩阵
  15. Mvtec数据集批量加各种噪声(高斯,椒盐,随机噪声)
  16. 有人居然参加了中本聪的私募会 | 论伪区块链对投资者的毒害
  17. maxwell详细介绍
  18. 计算机中丢失vcomp110.dll,进击的巨人vcomp110.dll丢失错误解决方法一览
  19. rm 命令过滤式删除
  20. 【动手学深度学习PyTorch版】13 卷积层的填充和步幅

热门文章

  1. python写一个ssh工具_Python3制作简易SSH登录工具|python3教程|python入门|python教程
  2. Python-实战:基于鲸鱼WOA的VMD超参数优化
  3. 医用计算机模型,计算机制作模型
  4. CAP和BASE理论
  5. 客户机服务器模式(C/S模式)
  6. css如何快速将网站设置为灰色背景
  7. BC1.2协议CDP
  8. RTKLIB :postpos(后处理)
  9. php ems 框架,phpems数据库设计
  10. [小技巧]在word中输入11以上带圈数字序号