还敢吹「毫无PS痕迹」?小心被Adobe官方AI打脸
郭一璞 发自 麦拜德
量子位 报道 | 公众号 QbitAI
自从有了PS,“有图有真相”就成了一句笑话。
比如朋友圈那些忽悠人的微商:
马爸爸为微商站台?
假的吧?
当阿里公关吃素的呀?
“貌美”的微商小姐姐和思聪他爸一起出席会议?
思聪呀,你爸爸糊成这样了你知道么?
不过,现在,马里兰大学与开发出PS的那家逗比公司(Adobe)合作,开发了一项新技术:
一个能找出PS痕迹的AI。
这些P图骗人党彻底被打脸了。
火眼金睛:拼贴、复制、删除一招搞定
关于这个火眼金睛的AI技术的论文发表在了CVPR上。
这项技术能检测出多种P图手法,包括拼贴、复制和删除的元素。
拼接
这项技术可以找出那些后期加上去的元素。
比如,这张巨石前的向日葵:
其实是P的,原图长这样:
根本没有向日葵,只有光秃秃的岩石和海鸟,向日葵是后期P上去的。
复制
为了显得没有违和感,许多人喜欢把原图中的素材扣下来,复制一份,缩小一下再粘回原图的另一个位置。
比如,2008年的时候,伊朗为了吓唬人,发布了一张发射四枚导弹的照片:
然后被眼尖的吃瓜群众发现,从左至右第三枚导弹跟第二枚导弹长的一毛一样,甚至导弹烟雾尾巴上的渐变颜色都一样。
而且,发射导弹的地面上,中间那片云和右边那片云也一模一样,连空中飘的部分都不放过!
删除
看到不想出现在照片上的东西,那就把它抹掉,用周围的颜色材质盖住它。
比如这张照片,看起来……算了,看不出来是啥。
但它的中间被涂抹了一部分,原图长这样:
冒出了一条小鱼的头,大概是被设计师拿出来做剁椒鱼头了吧。
Adobe的新AI技术就可以识别出这3种P过的图,是否被添加了什么额外的东西、是否有复制的元素、是否被删除抹掉了什么东西。
找茬秘技の修炼法则
首先,需要准备一个Faster R-CNN网络,来执行端到端的训练,这个网络在检测语义对象时表现出了良好的性能。
现在,我们按照这样一个原理来侦破图片中的造假区域:
和普通的图片检测不同,Adobe家的这个技术用了双流检测的方法,即:
一个RGB流
RGB流用来寻找PS痕迹,比如,向日葵图中,向日葵边缘和背景的岩石之间明显不自然,对比度过高。
这就是RGB流需要寻找的“PS痕迹”。
同时,还需要用到区域提议网络(Region Proposal Network, RPN),它是Faster R-CNN的一部分,用来找那些看起来很可疑的部分。
一个噪声流
图片是有“噪声”的。
当一张图上的元素被扣下来放到另一张图上时,就会出现一个明显的噪声不同的区域。
当然,肉眼是无法看到的,但是机器可以判断出来。
比如这张图片上,格子地板上放了一个红色正方体。
这张图片看起来仿佛很正常,色调和谐,光影方向正常,没有什么异样的明暗对比。
但是,它的噪声流图片异常诡异:
正方体的前面出现了一个圆洞!
虽然在正方体和浅蓝色(本图为深色)地板上看不出什么问题,但是在黑色(本图为浅色)地板上格外明显。
有一个圆形的东西,在正方体的前方,凭空消失了。
所以,很明显,这片区域有鬼。
实际上,原图是这样的:
红色正方体前本来有一个黄球,在交给噪声流监测的图片上,黄球被P掉了。
池化&对比结合
在可疑图片经过RGB流和噪声流两条线索的监测之后,结果被放进了一个池化层进行池化。
分别对可疑区域得到不同的结果后,两种方法的结果加以对比,被P过的区域就可以明显找出来了。
实战演练
在实际应用中,双流效果的确不错。
比如这张图,看起来大概是日本的某个厂房旁边的停车场:
RGB流发现,左边蓝色的牌子上,两块牌子相邻处的上半部分(红框部分)实在是太诡异了。
放大看,是这样:
而噪声流则监测出了更多的bug:
一片黑漆漆!
整张图上的一个半蓝色广告牌,都不对劲。
一定是有人为了掩藏什么内容,把最左边的广告牌和第二个广告牌的上半部分涂成了蓝色。
所以真实的效果是下图,广告牌区域的确被P过。
再来看下一个例子,货架上的手包:
一眼看上去好像没什么毛病,就是同一款式深色浅色的两个包包而已。
但是,RGB流表示,两个包包都有问题:
而噪声流的结果有些不一样,右边的深色包包和它上面的标签都有问题:
既然你们意见不一样,那取个交集吧,右边的深色包包造假是石锤了:
来,公布正确答案:
找对了,本AI经验值+1。
可以看的出,相比此前的研究,马里兰大学和Adobe研发出的这个新型双流操作检测框架,不仅通过RGB流对视觉篡改伪像建模,而且能发现可疑区域噪声特征的差异。
作者在论文中写到,新研究的方法与此前最先进的方法相比,可以提高四个图像处理数据集的性能。
利空P图党
虽然,目前这项技术只是一篇论文,Adobe公司还没有将其产品化。不过Adobe官方对国外科技媒体THE VERGE说,他们准备继续推进该项技术,用来监测数字媒体中的虚假图片信息。
(*σ´∀`)σ 希望逗比家快点做出来,接入微信朋友圈,戳穿微商和蛇精脸们的真相。
最后,附论文传送门~
Learning Rich Features for Image Manipulation Detection
作者:Peng Zhou,Xintong Han,Vlad I. Morariu,Larry S. Davis
发表于CVPR 2018
arXiv:https://arxiv.org/abs/1805.04953
数据集:https://www.nist.gov/itl/iad/mig/nimble-challenge-2017-evaluation
— 完 —
实习生招聘
量子位正在招募市场运营实习生,策划执行AI明星公司CEO、高管等参与的线上/线下活动,有机会与AI行业大牛充分交流。
工作地点在北京中关村。简历欢迎投递到quxin@qbitai.com
具体细节,请在量子位公众号(QbitAI)对话界面,回复“实习生”三个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
还敢吹「毫无PS痕迹」?小心被Adobe官方AI打脸相关推荐
- 震撼!英伟达用深度学习做图像修复,毫无ps痕迹
在计算机视觉研究领域,NVIDIA常常让人眼前一亮. 比如"用Progressive Growing的方式训练 GAN,生成超逼真高清图像","用条件 GAN 进行 20 ...
- 想要毫无PS痕迹,你得用它
在这个全民PS的时代,我们有幸欣赏到了会理县那张"毫无PS痕迹"的神作.颤抖吗?抓狂吗?不要悲伤,不要心急!时代并没有退步,下面这款软件会让我们知道,PS什么的都是浮云,真正的政府 ...
- 比ChatGPT还好用?亚马逊或将为卖家提供官方AI工具
前一段时间ChatGPT大火的时候,有不少大卖家都纷纷入局,表示已经接入了ChatGPT端口,计划将该工具应用在业务的各个方面. 从目前大部分卖家的反馈来看,ChatGPT的确可以在某些方面起到帮助, ...
- ChatGPT发明「史莱姆语」,词汇语法规则全都有,还配了「史翻英」Python代码
羿阁 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 好家伙,ChatGPT都能发明语言了??? 还不仅仅是对英文词汇搞些简单替换,什么从句.语法格之类的语法规则,也都弄得明明白白. 没错,现在 ...
- 【深度学习】揭秘2021抖音和快手APP图像修复背后的核心技术,毫无ps痕迹
作者 | 对白 出品 | 对白的算法屋 编者寄语: 本文看完,相信你会对抖音和快手APP中使用的图像修复技术有一番了解和掌握. 大家好,我是对白. 由于CNN.GAN.Transformer等模型在C ...
- 当初我要是这么学习JVM就好了「附图文解析」
文章目录 1. JVM 简介 2. JVM 运行流程 3. JVM 运行时数据区 3.1 程序计数器「线程私有」 3.2 Java虚拟机栈「线程私有」 3.3 本地方法栈「线程私有」 3.4 堆「线程 ...
- 「创式纪」人工智能应用创新大赛启动,首次结合商业计划和机器学习
谈到人工智能,技术和应用场景成为了大家广泛关注的话题.技术的演进,是推动人工智能发展的核心,而广泛的场景应用,则是人工智能真正价值所在.现阶段,精准营销.信贷风控.人脸比对等为人熟知的AI,已经经过落 ...
- openfire消息通知推送_微信小游戏内测「订阅消息」能力,这是召回用户的「大杀器」吗?...
作者:蒋鸿昌 本文来源于「知晓程序」公众号.知晓云后端云服务,让你的小程序开发快人一步,添加「minsupport3」了解详情. 知晓云cloud.minapp.com 一位投资人曾把最近 3 年微 ...
- 对话 IJCAI 07「卓越研究奖」得主 Alan Bundy :理解智能的本质是 AI 发展的终极目标
AI 科技评论按: 今年,IJCAI(国际人工智能联合会议,International Joint Conferences on Artificial Intelligence)将于 8 月 10 日 ...
最新文章
- 完全企业虚拟化方案-Total Enterprise Virtualization
- Spring4 MVC Hibernate4集成
- Windows服务器下升级PHP版本的方法
- 关于域帐户将计算机加入域登陆上限问题
- SAP销售和财务数据库表之间的关系
- 居然之家忍“刮骨疗伤”之痛拥抱新零售
- 戴尔服务器改win7系统,戴尔dell预装win10怎么改win7系统
- ng-template和对应生成的注释
- Marketing Cloud API消费entity unsupported format错误消息的处理
- 有用的Python模块 - pprint
- idea debug端口被占用
- Js、Jquery密码输入框的密码显示与隐藏
- 蒙特卡洛思想(Monte Carlo思想)
- Windows文件搜索软件Everything
- 最新前端vue,js,css,性能优化面试题66道题
- 拳头的国人动画师,是这样让《英雄联盟》里的角色变成“戏精”的
- 2014 青年歌手大奖赛_评委会打分
- SSO中的Pattern
- Rosenblatt感知器
- 电子信息科学与技术与计算机专业相近吗,电子信息科学与技术专业简介
热门文章
- 盘点开发者最爱的 IntelliJ 插件 Top 10
- 马斯克澄清“我不是中本聪”,比特币创始人究竟是谁?
- 循序渐进!java开发手册阿里巴巴泰山版
- layui 树状图默认全部展开_SolidWorks 钣金展开基础设定
- 沙盘模拟软件_3D电子心理沙盘系统
- python模型训练框架_Pytorch-Transformers 1.0发布,支持六个预训练框架,含27个预训练模型...
- 华为鸿蒙新机价格表,华为Mate30已确认:鸿蒙系统+巴龙5000,售价感人
- php程序如何保证3秒作出响应,这个留言本的响应时间总是在3秒左右,如何优化?...
- 总结关于 Vue 框架面试题
- java字符排序_Java实现对字符串中的数值进行排序操作示例