无平行文本照样破解密码,CipherGAN有望提升机器翻译水平
Root 编译整理
量子位 出品 | 公众号 QbitAI
有一位97年的少年,本科期间就进了微软、谷歌大脑实习。
不仅如此,他还参与了去年刷屏级论文Attention is All You Need的和One Model to Learn Them All的研究工作。
他,就是Aidan N. Gomez。
2月3号,Gomez作为一作和他在谷歌大脑的导师Kaiser往2018ICLR投的论文Unsupervised Cipher Cracking Using Discrete GANs被正式接收。
这篇论文介绍了非监督破译密码的模型CipherGAN,经非配对的明文密文训练后,可以高保真地破译凯撒移位密码或维吉尼亚密码。
加密 pk 解密
简单介绍一下移位密码和维吉尼亚密码。
最早的加密方法,是公元前58年,凯撒出于军事需要发明的移位密码。
通过把明文的字母往右移三位,可得到外人看了不知所言的密文。
但这个加密方法保密性一般,只要破译的人用穷举法,就可以知道偏移量了。
好在,那时候的人没什么文化,移位密码在军事上用了好几个世纪。
直到9世纪博学家AlKindi引入了字频统计破译法,即分析字母出现的频率,移位密码才终于被拉下神坛。
字频统计,就是分析字母出现的频率。
比如说在英语里面,最常出现的字母是e(12.7%),t(9.1%),a(8.2%),而q,x,z每一个频率都小于1%。还有同字母的双字母组,ss,ee,oo,都属于英文单词里常见的组合。
抓住语言结构特点,密码就迎刃而解。
移位密码被破之后,为了对抗字频统计破译法,维吉尼亚密码,最著名的多字母替换式密码应势而生。
维吉尼亚密码是有个密表的,相当于26个不同偏移量的凯撒密码叠在一起,以及以一个关键词不断重复的密钥。
只有拿到密钥的人对应着密表才能解出密文来。
比方说,明文是Holy high,密钥是wow。
那么对应着上面的密表,去w行找到h的密文是D,o行o的密文是C,以此类推,holy high的密文就是DCHU VECV。
破解密码的表现
以往破解密码的模型,在密文长度有限的情况下,还是可以破解出密钥很短的密文来的,正确率不错。
但如果密钥的关键词很长的话,正确率就很低了。
而该论文的工作,训练数据是非配对的明文和密文,也无需预置的人类语言学知识,就可以破译长词级的密钥。如下表所示⤵️
表中左边三列是CipherGAN的表现,表右边两列是以往模型的表现。
可以看出来,在解密三种词量长度(10,200,58)的密文时,CipherGAN解密移位密码的表现近乎完美(100%,98.7%,99.8%)。
当密文有200个单词时:
1)CipherGAN破解移位加密的正确率可达到98.7%,是以往模型的两倍(44.5%);
2)维吉尼亚加密的密文以往模型的正确率完全不行,给了密钥才勉强能达到44.3%,而CipherGAN的正确率可达到75.7%。可以看出来CipherGAN比较擅长破译长词级密钥的密文。
该模型是基于图像风格转换模型CycleGAN(加我们自己的链接)作的修改,破译表现远高于以往频率分析的模型。
针对CipherGAN可以使用非平行文本作输入的特点,Gomez在接受Newsweek外媒采访的时候,也提到了,“密码破译的模型思路也能迁移到非监督学习的翻译上。”
因为语言翻译常面临的难题是,缺乏足够的平行语料。
正好和非配对明文密文的密码破译过程很相似。
Gomez希望Facebook和Google这种量级的巨头公司可以继续这个课题,把CipherGAN用在提高机器翻译水平上。
“我们提出的算法,对任何两种文本信息都是通用的。不一定非要纯文本或者暗号,也可以是英语和法语。”Gomez说。
OMT
破解密码模型工作的,是整个for.ai研究团队。一共5个小伙子,都是多伦多大学计算机系的学生。
Gomez文章开头介绍过就不多说了。
左一是还在念大三的Sheldon Huang,创办了多伦多大学机器智能学生社团UTMIST,是UTMIST主席。
左二是已经休学的Ivan Zhang,曾在Ranomics工作了两年,加入For.ai将近1年。
右二是Muhammad Osama,今年Gomez一起拿到了荣誉学士学位,于18年6月毕业。
最右边的是香港小伙子Bryan Li,曾在华为香港和AMD实习过。
除了专研AI课题,这几个小伙子还在自己的简历里谈到自己有不少兴趣爱好,有喜欢画画的,有喜欢摄影的,还有喜欢玩乐器的。
量子位前往个人的Ins上推上看了看,样样出手都鹅妹子嘤。大家感受一下⤵️
△ The darker the night, the brighter the stars
by Bryan Li
最后,附论文地址,
https://arxiv.org/abs/1801.04883
及高质的同行评议,
https://openreview.net/forum?id=BkeqO7x0-
及开源代码的地址,
https://github.com/for-ai/CipherGAN
For.ai团队的官网
https://For.ai
— 完 —
加入社群
量子位AI社群13群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot5入群;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进群请加小助手微信号qbitbot5,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
无平行文本照样破解密码,CipherGAN有望提升机器翻译水平相关推荐
- 搜索,然后学习:两阶段的无监督文本生成
论文标题: Unsupervised Text Generation by Learning from Search 论文作者: Jingjing Li, Zichao Li, Lili Mou, X ...
- john工具破解密码(Linux、ZIP等)
目录 官网 介绍 测试 安装 ubuntu centos 安装完成查看 使用 john.pot 文件 官网 支持Win.Lin.Mac等 https://www.openwall.com/john/ ...
- 用 Mathematica 破解密码
Mathematica可以让您感觉自己像个计算超人.带着这种态度和一些小学生的密码学知识,我本周将注意力转向了密码破解,结果却发现了埋藏的氪石. 密码的弱点(您用相同的不同字母交换消息中出现的每个特定 ...
- [经典]“Free Rainbow Tables”分布式计算破解密码
"Free Rainbow Tables"分布式计算破解密码 By simon ~ 一月 20th, 2008. Filed under: Linux桌面应用, windows应用 ...
- 渗透测试之破解密码(3)
渗透测试之破解密码(3) 常见密码破解技术 被动在线攻击 主动在线攻击 离线攻击 彩虹表 使用彩虹表破解密码 使用非技术性方法 使用闪存驱动器窃取密码 提升权限 TRK(Trinity Rescue ...
- 破解密码的8种典型手段与防护建议
提到黑客攻击,你会想到什么?一个恶意行为者坐在满是<黑客帝国>式数字文本的屏幕前?或是一台强大的超级计算机正试图入侵整个世界?事实上,很多网络攻击可能只涉及一件事--破解你的密码.如果有人 ...
- CCNA-第五篇-基础命令集+设备升级+设备破解密码+IP地址{精髓篇}
** CCNA-第五篇-基础命令集 ** 1.基础命令集 思科设备 : IOS 华为设备: VRP 启动步骤:加电自检-加载系统(IOS/VRP)-运行配置(保留的cfg或者conf文件) 命令行统一 ...
- 【Science】破解密码“AlphaGo”诞生,训练Gan破解27%LinkedIn测试集密码
本文讲的是破解密码"AlphaGo"诞生,训练Gan破解27%LinkedIn测试集密码,一项新的研究旨在使用生成对抗网络(GAN) 来加快密码破解的速度.斯蒂文斯理工学院的研究人 ...
- 【BIO】Socket 编程:记曾经做过的课设(字典破解密码,附全部实验代码)
字典破解密码: 设计一个信息系统,该系统可为学籍管理系统.订餐系统.票务管理系统不限, 系统必须通过客户端录入账号口令远程登录: 系统内至少包含三个以上账号,密码为 6 位以上任意字符组成: 设计程序 ...
最新文章
- paip.最好的脚本语言node js 环境搭建连接mysql
- 陕西省计算机等级考试试题库,2015陕西省计算机等级考试二级最新考试试题库...
- Mycat探索之旅(3)----Mycat的全局序列号
- pageHelper插件
- 单样本学习与孪生网络
- 阿里联合学界开源大型3D场景数据集,6813个户型,几何与纹理细节丰富
- 网络管理与维护作业11
- ubuntu自动加载硬盘分区
- LINUX使用OpenSSL进行签名
- 增持风行网 百视通在下一盘很大的棋
- bp神经网络算法原理 Levenberg Marquardt
- Cisco ❀ 双向地址转换(源地址转换+地址映射)
- 解决Wireshark抓包跟踪流后http的响应正文乱码
- 2018第九届蓝桥杯JavaA组省赛真题详解
- HBase配置AES加密
- Haar小波提升算法
- python遇到执行超时如何跳过避免任务卡死
- 易拉罐WiFi收集器
- signature=501807407682dd47ffe7345fc7b18d2e,Signature-Free Intrusion Detection
- ondrive网盘php,IT之家学院:利用OneIndex + OneDrive搭建私人网盘(可对外公开) - IT之家...
热门文章
- mysql两个空值相同吗_你知道mysql中空值和null值的区别吗
- 服务器项目部署工具,通过工具SecureCRTPortable将项目部署到服务器上
- python图像分类需要什么环境_Python学习简单图像识别分类,python
- 清华大学信息 计算机科学与技术,清华大学信息科学与技术国家实验室
- oracle说不能初始化失败,PLSQLDeveloper 提示不能初始化?
- token会被截取吗_做抖音搬运其他网站视频可以吗?
- 为什么要使用 React-Redux?
- 567.字符串的排列
- 13.罗马数字转整数-LeetCode
- 浏览器html5视频抓取,检测浏览器是否支持html5视频的代码