金磊 发自 凹非寺
量子位 | 公众号 QbitAI

讲个恐怖的故事。

早上跟同事在微信闲谈,聊起了一位女同事最近的变化。

结果他反手就把文字打上马赛克,截图丢进了群里:

还欠欠儿地补了一刀:

@XXX,他说你坏话了呦~

万万没想到,这位同事气势汹汹地走了过来,竟然直接点出了“秘密文字”的内容。

当时的我是这样的:

见状,这位老师补充道:

都什么年代了,以为打马赛克我就认不出来了?分分钟还原好吧!

……

好奇如我,马上对这个技术展开了一番“调查”。

(PS:聊天原图在文末揭晓)

如何还原打了马赛克的文字?

还别说,国外一家公司的首席研究员Dan Petro(下文简称Dan),这两天就发布了这么一篇帖子。

他直接点出了重点:

打马赛克(像素化),是一种非常不好、不安全,而且会泄露敏感数据的方法。

为了验证他的说法,Dan亲自下场写了一个名为 Unredacter 的工具。

然后现场演示了一下,这个工具是如何一点一点把打了马赛克的文字还原的:

从上面的示例中,不难看出,即便原文打了厚厚的一层马赛克,在这个工具面前依旧像“裸奔”一样。

或许你会说,这玩意儿操作起来会很复杂吧?

不不不。

非常之简单,仅仅是2个步骤:

  • 用npm install安装依赖项

  • 用npm start来启动

虽然在Dan之前,已经有类似的工具存在了,例如 Depix

但一个非常现实的问题就是,Depix还原的文字,从视觉效果上并不是很好:

Depix还原出来的文字,有些地方的还是糊糊的。

因此,国外Jumpsec Lab的一位研究员指出了这个问题,并且还附上了一道比较有意思的挑战:

如果你破解了密码,请联系我们。

这样的挑战便引起了Dan极大的兴趣,这也就是他开发Unredacter的原因。

于是,在Unredacter的加持下,Dan顺利攻破了这项挑战:

而后Dan联系上了这位研究员,在邮件的回复中,也证实了Dan的结果是正确的:

不仅如此,Dan还介绍说,像类似用涂抹方式来打的马赛克,无论是在GiMP、Photoshop或者其它编辑器中,结果都是一样的。

因此,他的破解方法应当是具备一定的通用性。

当然,生活中我们或多或少都会有“打码”的需求,既然马赛克不安全,那有没有更好的方式呢?

Dan对此的答复是:

用黑色条来遮挡。

还有还原打了马赛克的图片

其实“还原马赛克”这件事,AI界早就有所研究。

例如杜克大学提出的 PLUSE便是其中之一,还登顶了CVPR。

但它修复的并不是文字,而是人像,例如:


从原理角度来看,它本质上是生成对抗网络 (GAN)。

PLUSE主要是根据模糊的马赛克像素,“画”出新的一张张不存在的人脸,再压缩回马赛克状态跟原图比一比,把相似的版本拿出来展示。

当然,这项技术也并非完美,也有翻车的时候。

例如网友就拿马里奥试了试,结果……

Emmm……这“味道”,不一般。

One More Thing

最后,来揭晓一下开头故事的答案。

着实是个惨痛的教训了……

项目地址:

https://github.com/bishopfox/unredacter

参考链接:

[1]https://bishopfox.com/blog/unredacter-tool-never-pixelation
[2]https://labs.jumpsec.com/can-depix-deobfuscate-your-data/
[3]https://arxiv.org/abs/2003.03808

聊天截图厚码也不安全,大神写了算法分分钟给你还原相关推荐

  1. Codeforces 793b B. Igor and his way to work 觉得大神写的3维bfs太复杂,突然发现这题是连连看算法。

    看大神写的dp[x][y][c]表示的(x,y)位置c方向的三维DFS, 这题说是转不超过两个弯,其实就是连连看. 扫描S和T左右上下达到的最大点. 左右上下都取S和T达到的最小范围. 1.用左右范围 ...

  2. ❤️MIT大神写给女神的Q版Python画图库—Cutecharts

    MIT大神写给女神的Q版Python画图库-Cutecharts 画图不好看?不可爱?不萌?本文二哥教大家来进行Q版绘图. [建议先点赞.再收藏] 还记得那是一个月黑风高的晚上,一位女同事让我给他讲解 ...

  3. 程序员如何应对中年危机,撸了大神写的spring源码笔记,超详细

    前言: 我们通常在面试的时候难免会慌张不已.想必,经历过的人都能体会.但是如果你提前预测和准备面试官要问你的问题,并想出合理的回答方式,就会轻松很多.所以接下来的面试题是我从自己和其他人的面试经历中总 ...

  4. 看完微软大神写的求平均值代码,我意识到自己还是 too young 了

    博雯 发自 凹非寺 量子位 | 公众号 QbitAI取整求个无符号整数的平均值,居然也能整出花儿来? 这不,微软大神Raymond Chen最近的一篇长文直接引爆外网技术平台,引发无数讨论: 无数人点 ...

  5. 看完微软大神写的求平均值代码,我意识到自己还是too young了

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 博雯 发自 凹非寺 量子位 | 公众号 QbitAI 取整求个无符号整数的平均值,居然 ...

  6. python大神写的代码_初学Python,只会写简单的代码。手头有份Python代码,但是调用C模块生成的.pxd和.pyx文件,运行过程总报错,希望大神指点,调试前该做哪些工作呢?...

    报错内容如下: Traceback (most recent call last): File "E:\Python27\setup.py", line 16, in from s ...

  7. MIT大神写给女神的Q版Python画图库—Cutecharts

    Cutecharts 还记得那是一个月黑风高的晚上,一位女同事让我给他讲解数据分析结果的时候,我默默的用python画了下面这张图. 依稀记得女同事看了之后,立刻转身离去,并留下了一句"哼, ...

  8. iOS 项目源码大全 github 国内外大神

    github排名https://github.com/trending,github搜索:https://github.com/search 主要工作说明: 重新整理了Xcode好用的插件,信息更详细 ...

  9. 撸了郭霖大神写的Framework源码笔记,Android篇

    前言 我们程序员之所以担心35岁被裁员,是因为自己的经验和实力能力不符合,国内IT现状,大多数程序员都在外包公司工作,框架老化,代码就是为了完成任务而写,刚定好需求你做一半产品突然让你改需求--一切的 ...

最新文章

  1. python之路之面向对象3
  2. 前言:写python和django博客的背景
  3. 2D 游戏引擎 AlloyGameEngine
  4. Leaflet中实现添加比例尺控件与自定义版权控件与链接
  5. 【知识小课堂】mongodb 之 特殊集合及索引
  6. mysqlbinlog: [ERROR] unknown variable ‘default-character-set=utf8mb4‘
  7. 我为期一个月的GitHub的经验教训
  8. HTML+CSS+JS 表白代码
  9. 计算机中考什么时候报名,中考报名时间
  10. get url img
  11. Zookeeper基础使用
  12. java 命令行 库_java以太坊库web3j文档
  13. C语言实现扫雷游戏(详解)
  14. cad在哪里设置图幅大小_CAD新建图纸怎么设置视图范围太小?
  15. 数据库实验一——数据定义
  16. mysql身份证来算年龄_MySQL 根据身份证出生年月计算年龄户籍地性别
  17. java 排名算法_排行榜的算法
  18. 浅析BootStrap
  19. 用普通话软件测试为什么分数都很低,有没有练习普通话的软件?练习普通话软件推荐...
  20. oracle确认AMM是否开启,【AMM】关于数据库实例AMM参数说明

热门文章

  1. 关于解决GPS定位设备:GPS静态漂移的方法
  2. Data truncation: Truncated incorrect DOUBLE value 解决方案
  3. 如何使用cout以全精度打印双精度值?
  4. 将java.time.LocalDate转换为java.util.Date类型
  5. js进阶课程 12-9 jquery的事件对象event的方法有哪些?
  6. 产品经理原型图神器有望超越Axure 的软件sketch 48.2 for Mac 中文破解版下载
  7. Java Security:keytool工具使用说明
  8. 基于jquery的无刷新表格分页
  9. Jenkins执行脚本,提示“sudo: no tty present and no askpass program specified”解决方法
  10. element ui 图片控件 排序_Element-ui上传图片后隐藏上存控件