郭一璞 发自 麦拜德 
量子位 报道 | 公众号 QbitAI

自从有了PS,“有图有真相”就成了一句笑话。

比如朋友圈那些忽悠人的微商:



马爸爸为微商站台?

假的吧?

当阿里公关吃素的呀?



“貌美”的微商小姐姐和思聪他爸一起出席会议?

思聪呀,你爸爸糊成这样了你知道么?

不过,现在,马里兰大学与开发出PS的那家逗比公司(Adobe)合作,开发了一项新技术:

一个能找出PS痕迹的AI

这些P图骗人党彻底被打脸了。

火眼金睛:拼贴、复制、删除一招搞定

关于这个火眼金睛的AI技术的论文发表在了CVPR上。

这项技术能检测出多种P图手法,包括拼贴、复制和删除的元素。

拼接

这项技术可以找出那些后期加上去的元素。

比如,这张巨石前的向日葵:



其实是P的,原图长这样:



根本没有向日葵,只有光秃秃的岩石和海鸟,向日葵是后期P上去的。

复制

为了显得没有违和感,许多人喜欢把原图中的素材扣下来,复制一份,缩小一下再粘回原图的另一个位置。

比如,2008年的时候,伊朗为了吓唬人,发布了一张发射四枚导弹的照片:



然后被眼尖的吃瓜群众发现,从左至右第三枚导弹跟第二枚导弹长的一毛一样,甚至导弹烟雾尾巴上的渐变颜色都一样。

而且,发射导弹的地面上,中间那片云和右边那片云也一模一样,连空中飘的部分都不放过!

删除

看到不想出现在照片上的东西,那就把它抹掉,用周围的颜色材质盖住它。

比如这张照片,看起来……算了,看不出来是啥。



但它的中间被涂抹了一部分,原图长这样:



冒出了一条小鱼的头,大概是被设计师拿出来做剁椒鱼头了吧。

Adobe的新AI技术就可以识别出这3种P过的图,是否被添加了什么额外的东西、是否有复制的元素、是否被删除抹掉了什么东西。

找茬秘技の修炼法则

首先,需要准备一个Faster R-CNN网络,来执行端到端的训练,这个网络在检测语义对象时表现出了良好的性能。

现在,我们按照这样一个原理来侦破图片中的造假区域:



和普通的图片检测不同,Adobe家的这个技术用了双流检测的方法,即:

一个RGB流

RGB流用来寻找PS痕迹,比如,向日葵图中,向日葵边缘和背景的岩石之间明显不自然,对比度过高。



这就是RGB流需要寻找的“PS痕迹”。

同时,还需要用到区域提议网络(Region Proposal Network, RPN),它是Faster R-CNN的一部分,用来找那些看起来很可疑的部分。

一个噪声流

图片是有“噪声”的。

当一张图上的元素被扣下来放到另一张图上时,就会出现一个明显的噪声不同的区域。

当然,肉眼是无法看到的,但是机器可以判断出来。

比如这张图片上,格子地板上放了一个红色正方体。



这张图片看起来仿佛很正常,色调和谐,光影方向正常,没有什么异样的明暗对比。

但是,它的噪声流图片异常诡异:



正方体的前面出现了一个圆洞!

虽然在正方体和浅蓝色(本图为深色)地板上看不出什么问题,但是在黑色(本图为浅色)地板上格外明显。

有一个圆形的东西,在正方体的前方,凭空消失了。

所以,很明显,这片区域有鬼。

实际上,原图是这样的:



红色正方体前本来有一个黄球,在交给噪声流监测的图片上,黄球被P掉了。

池化&对比结合

在可疑图片经过RGB流和噪声流两条线索的监测之后,结果被放进了一个池化层进行池化。

分别对可疑区域得到不同的结果后,两种方法的结果加以对比,被P过的区域就可以明显找出来了。

实战演练

在实际应用中,双流效果的确不错。

比如这张图,看起来大概是日本的某个厂房旁边的停车场:



RGB流发现,左边蓝色的牌子上,两块牌子相邻处的上半部分(红框部分)实在是太诡异了。

放大看,是这样:



而噪声流则监测出了更多的bug:



一片黑漆漆!

整张图上的一个半蓝色广告牌,都不对劲。

一定是有人为了掩藏什么内容,把最左边的广告牌和第二个广告牌的上半部分涂成了蓝色。

所以真实的效果是下图,广告牌区域的确被P过。



再来看下一个例子,货架上的手包:



一眼看上去好像没什么毛病,就是同一款式深色浅色的两个包包而已。

但是,RGB流表示,两个包包都有问题:



而噪声流的结果有些不一样,右边的深色包包和它上面的标签都有问题:



既然你们意见不一样,那取个交集吧,右边的深色包包造假是石锤了:



来,公布正确答案:



找对了,本AI经验值+1。

可以看的出,相比此前的研究,马里兰大学和Adobe研发出的这个新型双流操作检测框架,不仅通过RGB流对视觉篡改伪像建模,而且能发现可疑区域噪声特征的差异。

作者在论文中写到,新研究的方法与此前最先进的方法相比,可以提高四个图像处理数据集的性能。

利空P图党

虽然,目前这项技术只是一篇论文,Adobe公司还没有将其产品化。不过Adobe官方对国外科技媒体THE VERGE说,他们准备继续推进该项技术,用来监测数字媒体中的虚假图片信息。

(*σ´∀`)σ 希望逗比家快点做出来,接入微信朋友圈,戳穿微商和蛇精脸们的真相。

最后,附论文传送门~
Learning Rich Features for Image Manipulation Detection
作者:Peng Zhou,Xintong Han,Vlad I. Morariu,Larry S. Davis
发表于CVPR 2018
arXiv:https://arxiv.org/abs/1805.04953
数据集:https://www.nist.gov/itl/iad/mig/nimble-challenge-2017-evaluation

实习生招聘

量子位正在招募市场运营实习生,策划执行AI明星公司CEO、高管等参与的线上/线下活动,有机会与AI行业大牛充分交流。

工作地点在北京中关村。简历欢迎投递到quxin@qbitai.com

具体细节,请在量子位公众号(QbitAI)对话界面,回复“实习生”三个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

还敢吹「毫无PS痕迹」?小心被Adobe官方AI打脸相关推荐

  1. 震撼!英伟达用深度学习做图像修复,毫无ps痕迹

    在计算机视觉研究领域,NVIDIA常常让人眼前一亮. 比如"用Progressive Growing的方式训练 GAN,生成超逼真高清图像","用条件 GAN 进行 20 ...

  2. 想要毫无PS痕迹,你得用它

    在这个全民PS的时代,我们有幸欣赏到了会理县那张"毫无PS痕迹"的神作.颤抖吗?抓狂吗?不要悲伤,不要心急!时代并没有退步,下面这款软件会让我们知道,PS什么的都是浮云,真正的政府 ...

  3. 比ChatGPT还好用?亚马逊或将为卖家提供官方AI工具

    前一段时间ChatGPT大火的时候,有不少大卖家都纷纷入局,表示已经接入了ChatGPT端口,计划将该工具应用在业务的各个方面. 从目前大部分卖家的反馈来看,ChatGPT的确可以在某些方面起到帮助, ...

  4. ChatGPT发明「史莱姆语」,词汇语法规则全都有,还配了「史翻英」Python代码

    羿阁 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 好家伙,ChatGPT都能发明语言了??? 还不仅仅是对英文词汇搞些简单替换,什么从句.语法格之类的语法规则,也都弄得明明白白. 没错,现在 ...

  5. 【深度学习】揭秘2021抖音和快手APP图像修复背后的核心技术,毫无ps痕迹

    作者 | 对白 出品 | 对白的算法屋 编者寄语: 本文看完,相信你会对抖音和快手APP中使用的图像修复技术有一番了解和掌握. 大家好,我是对白. 由于CNN.GAN.Transformer等模型在C ...

  6. 当初我要是这么学习JVM就好了「附图文解析」

    文章目录 1. JVM 简介 2. JVM 运行流程 3. JVM 运行时数据区 3.1 程序计数器「线程私有」 3.2 Java虚拟机栈「线程私有」 3.3 本地方法栈「线程私有」 3.4 堆「线程 ...

  7. 「创式纪」人工智能应用创新大赛启动,首次结合商业计划和机器学习

    谈到人工智能,技术和应用场景成为了大家广泛关注的话题.技术的演进,是推动人工智能发展的核心,而广泛的场景应用,则是人工智能真正价值所在.现阶段,精准营销.信贷风控.人脸比对等为人熟知的AI,已经经过落 ...

  8. openfire消息通知推送_微信小游戏内测「订阅消息」能力,这是召回用户的「大杀器」吗?...

    作者:蒋鸿昌 本文来源于「知晓程序」公众号.知晓云后端云服务,让你的小程序开发快人一步,添加「minsupport3」了解详情. 知晓云​cloud.minapp.com 一位投资人曾把最近 3 年微 ...

  9. 对话 IJCAI 07「卓越研究奖」得主 Alan Bundy :理解智能的本质是 AI 发展的终极目标

    AI 科技评论按: 今年,IJCAI(国际人工智能联合会议,International Joint Conferences on Artificial Intelligence)将于 8 月 10 日 ...

最新文章

  1. 完全企业虚拟化方案-Total Enterprise Virtualization
  2. Spring4 MVC Hibernate4集成
  3. Windows服务器下升级PHP版本的方法
  4. 关于域帐户将计算机加入域登陆上限问题
  5. SAP销售和财务数据库表之间的关系
  6. 居然之家忍“刮骨疗伤”之痛拥抱新零售
  7. 戴尔服务器改win7系统,戴尔dell预装win10怎么改win7系统
  8. ng-template和对应生成的注释
  9. Marketing Cloud API消费entity unsupported format错误消息的处理
  10. 有用的Python模块 - pprint
  11. idea debug端口被占用
  12. Js、Jquery密码输入框的密码显示与隐藏
  13. 蒙特卡洛思想(Monte Carlo思想)
  14. Windows文件搜索软件Everything
  15. 最新前端vue,js,css,性能优化面试题66道题
  16. 拳头的国人动画师,是这样让《英雄联盟》里的角色变成“戏精”的
  17. 2014 青年歌手大奖赛_评委会打分
  18. SSO中的Pattern
  19. Rosenblatt感知器
  20. 电子信息科学与技术与计算机专业相近吗,电子信息科学与技术专业简介

热门文章

  1. 盘点开发者最爱的 IntelliJ 插件 Top 10
  2. 马斯克澄清“我不是中本聪”,比特币创始人究竟是谁?
  3. 循序渐进!java开发手册阿里巴巴泰山版
  4. layui 树状图默认全部展开_SolidWorks 钣金展开基础设定
  5. 沙盘模拟软件_3D电子心理沙盘系统
  6. python模型训练框架_Pytorch-Transformers 1.0发布,支持六个预训练框架,含27个预训练模型...
  7. 华为鸿蒙新机价格表,华为Mate30已确认:鸿蒙系统+巴龙5000,售价感人
  8. php程序如何保证3秒作出响应,这个留言本的响应时间总是在3秒左右,如何优化?...
  9. 总结关于 Vue 框架面试题
  10. java字符排序_Java实现对字符串中的数值进行排序操作示例