点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—> CV 微信技术交流群

转载自:机器之心

人工智能 DALLE 善于画出各种神奇图像的原因在于——它不说人话。

「我们发现 DALLE-2 似乎有一个隐藏的词汇表,用于生成各种荒谬描述内容的图像。例如,Apoploe vesrreaitais 似乎是指鸟类,而 Contarra ccetnxniams luryca tanniounons 有时指虫子。我们发现这些 prompt 通常在孤立的情况下是一致的,但有时也是组合的,」研究人员写道。

DALL-E 生成的各种诡异图片在社交网络上刷屏已经持续了一段时间,有关为什么人工智能可以生成自然界中不存在的事物,很多研究者正在寻根问底。近日,来自德克萨斯大学奥斯丁分校的学者发现,DALL-E2 会使用看似随机但与视觉概念有一些关联的单词来形容自己做的事。

简而言之,AI 自创了一门语言,这份可解释性研究让人们细思极恐,连 Gary Marcus 也受到震撼。

自从 OpenAI 发布 DALLE 和 DALLE-2 以来,多模态大模型的视觉生成能力有目共睹。它们以文本标题作为输入,就能生成与给定文本相匹配的高质量图像。

DALLE-2 使用无分类器的扩散引导,但其众多周知的局限性是它会与文本相抗。比如文本 prompt 是「An image of the word airplane」的时候,通常会导致生成图像完全没听懂文本的内涵。研究者们发现,这个生成的文本不是随机的,而是揭示了一套隐藏的体系,这个词汇模型似乎是从内部发展出来的。比如说,当输入这些不知所云的的文本时,模型经常会生成飞机。

这些隐藏词汇中的一些是可以被学习的,并用来创造出一些离奇的 prompt,最终生成自然的图像。例如,Apoploe vesrreaitais 似乎意味着「鸟类」,Contarra ccetnxniams luryca tanniounons 有时则意味着「虫子」或「害虫」。研究者发现,可以用「An image of a cartoon apoploe vesrreaitais」这样的 prompt 来生成卡通鸟类图像,甚至可以组合这些词来创造以鸟类为食的虫子。

也有人提了一句,这种现象并不是首次出现。早在几年前,Facebook 的一个机器人就开始使用自己的 pidgin 语言进行交流。

也有人说,这个故事不过是类似当年的「聪明汉斯」实验罢了:

发现 DALLE-2 的「黑话」

偶然发现之后,研究者摸索出了一个简单的方法来发现 DALLE-2 的黑话,这个规律可以通过一个例子来体现:

假设我们想要找到「蔬菜」(vegetables)对应的黑话,就可以用下列句子之一(或者这些句子的变体)来作为 DALLE-2 的 prompt:

  • 上面写着蔬菜这个单词的一本书;

  • 两个农民在谈论蔬菜,带字幕;

  • 用 10 种语言书写的蔬菜这个词。

对于上面的每个 prompt,DALLE-2 通常会创建包含一些包含文本的图像。对于人类来说,这些书写出来的文本通常是胡言乱语,原始论文和 Marcus 的评论里都提到了这一点。

然而,研究者观察到一个令人惊讶的现象:这些文本并不像它看起来那样「混乱」。在许多情况下,它与想要翻译的单词密切相关。

比如我们将 prompt 设置为「两个农民在谈论蔬菜,带字幕」,就会得到如图 2(a)这样的图像。如果解析这个出现在图像中的文本,并将其继续作为 prompt,得到的结果如图 2(b)和(c)所示,

似乎 Vicootes 就是蔬菜的意思,Apoploe vesrreaitais 就是鸟类的意思,看起来两位农民在讨论鸟类干扰了他们的蔬菜。

当然,研究者也注意到,这个简单的方法并不总是有效的。有时,当 prompt 返回模型时,生成文本也会随机显示图像。然而,他们也发现,通过一些实验 (选择一些词语,运行不同的生成文本等等) ,通常可以找到随机出现的词语,并与一些视觉概念(至少在一些上下文上) 相关。关于这个规律,任何感兴趣的人都可以继续去挖掘。

黑话词汇表

此外,研究者还对已发现的 DALLE-2 黑话性质进行了初步研究。

组合性。从前面的例子中,我们了解到,Apoploe vesrreaitais 似乎是鸟类的意思。通过重复农民的实验,我们还了解到: Contarra ccetnesniams luryca tanniounons 可能意味着「害虫」或「虫子」。

一个有趣的问题是,我们是否可以像在普通语言中那样,把这两个概念组合成一个句子?图 1 已经说明了这是可能的,至少有时是这样。「Apoploe vesrreaitis eating Contarra ccetnxniams luryca tannions」给出了鸟类吃虫子的图像。研究者的发现是,这种情况只发生在部分图片上,并非所有生成的图片都是如此。

风格转换。DALLE-2 能够根据 prompt 中指定的不同风格,生成某些概念的图像。例如,你可能会要求一张苹果的逼真图像,或者一张展示苹果的线条艺术图。研究者测试了一些发现的单词 (例如 Apoploe vesrreaitais) 是否与视觉概念相对应,这些视觉概念可以根据 prompt 的上下文转换为不同的样式。实验结果如图 3 所示,似乎这种 prompt 有时会导致生成飞虫而不是鸟类。

DALL-E 2 在 prompt「Apoploe vesrreaitais」下生成的不同图像。这些图像都保持了同一个要素:「会飞的东西」。

文本与标题及生成图像的一致性。回忆一下刚才农民的例子,prompt 是「两个农民在谈论蔬菜,带字幕」。从这个例子中,研究者发现了蔬菜和鸟类这两个词。两个农民谈论鸟类确实是极有可能的,因此这提出了一个非常有趣的问题,即 DALLE-2 的文本输出是否与文本条件和生成的图像一致。

最初的实验表明,有时得到的乱码文本会转化为与最初创建的乱码文本标题相匹配的视觉概念。例如,prompt「两只鲸鱼在谈论食物,带字幕」生成了带有文本「Wa ch zod ahaakes rea」(或至少接近这个)的图像。研究者将此文本作为 prompt 提供给模型,并在生成的图像中看到了一些「海鲜」,如图 3 所示。似乎乱码文本确实具备有时与产生它的文本条件一致的含义。

图 4:左:使用 prompt:「Two whales talking about food, with subtitles」生成的图像;右图:使用 prompt:「Wa ch zod ahaakes ‍rea.」生成的图像。乱码文本「Wa ch zod ahaakes rea.」会生成与第一张图像的标题和视觉输出相关的图像。‍

安全性和可解释性挑战

DALL-E 2 的语言」让我们大开眼界,来的研究出现了一些有趣的方向。研究者表示某些乱码也许是不同语言中正常单词的拼写错误,但尚未搜索到此类示例。许多 prompt 中词的来源仍然令人困惑,并且在该研究的初步实验中,其中一些词与其他词不一致。

另一个有趣的问题是 Imagen 是否也有类似的隐藏词汇表,因为它是用语言模型而不是 CLIP 训练的。研究者推测 DALL-E 的 prompt 是 CLIP 文本编码器的对抗性示例,即「Apoploe vesrreaitais」的向量表征接近「鸟类(bird)」的表征。研究者试图在 CLIP 上使用其他对抗性攻击方法(例如白盒)来生成荒谬的文本 prompt,并用 DALL-E 2 生成目标图像。

稳健性和局限性

最重要的问题之一是所用方法的一致性。例如,该研究初步研究表明,像「Contarra ccetnxniams luryca tanniounons」 这样的 prompt 有时存在 bug,多次实验生成的图像不一致;而 「Apoploe vesrreaitais」这样的 prompt 则更加稳健。

研究者还强调,寻找其他强大的 prompt 具有挑战性,需要大量的实验。该研究尝试了各种让 DALL-E 生成图像的方法,并测试生成文本的一致性。虽然这种方法适用于一些乱码 prompt(很难找到),但这仍然是一个很大的可解释性和安全性问题。如果一个系统以非常不可预测的方式运行,即使这种情况很少发生,它仍然是一个重要的安全隐患,尤其是对于某些应用程序。

其中,首要的安全问题就是这些乱码 prompt 可能与后门对抗性攻击或一些绕过滤波器的方法有关。荒谬的 prompt 让我们对大型生成模型产生怀疑。显然,我们需要更多的基础研究来理解这些现象,并创建符合人类预期的语言和图像生成模型。

点击进入—> CV 微信技术交流群

ICCV和CVPR 2021论文和代码下载

后台回复:CVPR2021,即可下载CVPR 2021论文和代码开源的论文合集

后台回复:ICCV2021,即可下载ICCV 2021论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF

目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer6666,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群▲扫码或加微信: CVer6666,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!▲扫码进群
▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

研究者发现DALL-E 2在用自创语言生成图像:全文黑话,人类都看不懂...相关推荐

  1. 【深度学习】研究者意外发现DALL-E 2在用自创语言生成图像:全文黑话,人类都看不懂...

    机器之心报道 机器之心编辑部 人工智能 DALLE 善于画出各种神奇图像的原因在于--它不说人话. 「我们发现 DALLE-2 似乎有一个隐藏的词汇表,用于生成各种荒谬描述内容的图像.例如,Apopl ...

  2. 原子哥的STM32视频,我发现他们都看不懂原子哥里面按键扫描程序

    近身边的很多同学都在学习原子哥的STM32视频,我发现他们都看不懂原子哥里面按键扫描程序.由于问的人多,所以我也写了个心得,分享一下,老鸟别喷我哈.先贴上代码吧: //返回值: //0,没有任何按键按 ...

  3. 达不达标的公式计算机,“我面试了几百个大学生都不达标,发现他们连这3个Excel公式都看不懂!”...

    原标题:"我面试了几百个大学生都不达标,发现他们连这3个Excel公式都看不懂!" 顶公众号或 设为星标,否则可能收不到文章 当今职场竞争日益激烈,很多用人单位都提高了对求职者的各 ...

  4. 你的「在看」有人看,清华研究者发现「看一看」的这些规律

    点击上方"前端开发博客"关注公众号 回复"2"加入前端群 作者:Fanjin Zhang.Jie Tang等 机器之心编译 编辑:魔王 微信点「看一看」最活跃用 ...

  5. 博士意外发现秘密:DALL-E 2自创语言,人看不懂但能生成特定图像,可能会被用来搞事!...

    丰色 金磊 发自 凹非寺 量子位 | 公众号 QbitAI DALL·E 2,这个AI竟然自己搞了一套秘密语言. 例如这两个非常奇怪的词组: Apoploe vesrreaitais(下文简称A) C ...

  6. Science报道:中国研究者发现新型猪流感病毒,具有大流行病潜力

    近半年内,新型冠状病毒(COVID-19)肆虐全球.在国外各地疫情爆发的同时,中国的情况已经得到较好的控制.然而近日,中国研究人员又发现了一种可能人传人的新型流感病毒,引起人们关注. 29 日,来自中 ...

  7. 有人统计了2万篇论文发现:想增加引用量,最好少说「黑话」

    本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载 编辑:蛋酱 BERT.GAN.LSTM 都是些什么东西?对自己没有点信心,最好不要制造这么多新单词. 如果你想让自己 ...

  8. 我这才发现,原来我根本看不懂Java的正则表达式!

    正则表达式 (\w)((?=\1\1\1)(\1))+ (\w)((?=\1\1\1)(\1))+ 表达式说明: (\w) 表示匹配并捕获一个单词字符,将匹配内容作为第一个捕获组 (?=\1\1\1) ...

  9. 无限法则服务器错误代码,电脑打个无限法则没事儿重启,看系统管理器。提示如图错误代码,发现看不懂...

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 计算机已经从检测错误后重新启动.检测错误: 0x00000124 (0x0000000000000000, 0xffffcf8039118028, 0x0 ...

最新文章

  1. 工业总线通信与OSI七层模型
  2. 大一期末考试,python,测试题,含答案
  3. 百练OJ:4148:生理周期
  4. 【好程序员笔记分享】——下拉刷新和上拉加载更多
  5. 10.22 Ext JS 快速开发工具
  6. Python,Day2 - 数据类型,运算,列表操作,字典
  7. Lucas定理(求组合数,例题FZU2020,HDU3944)
  8. Acoustica Premium Edition Mac(音频编辑软件)
  9. c语言模拟试卷答案,C语言模拟试卷2(带答案)
  10. java特别描述错误的是,关于javac命令作用的描述错误的是
  11. BBS中用SSH方式登录添加附件
  12. 第70页的gtk+编程例子——快捷键
  13. python3 数独解法 深度遍历
  14. 苦禅箜mm让我帮她做的作业
  15. 易经- 第一卦 乾卦
  16. 如何免费拥有一个聊天机器人
  17. ReentrantLock和synchronized锁
  18. 将vscode打造成无敌的IDE(7)添加自定义C/C++的snippet
  19. 【天嵌使用教程】嵌入式主板VS2008开发windows C#基本流程
  20. 一天发十万封邮件方法_给老外发邮件,要注意这17点!

热门文章

  1. sql的左连接,右连接,内连接
  2. SRM 453.5(Div1)
  3. 输出21世纪中截止某个年份以来的所有闰年年份。注意:闰年的判别条件是该年年份能被4整除但不能被100整除、或者能被400整除。
  4. 报泰山学堂计算机条件,山东大学泰山学堂遭质疑 课程不合理致学生退学?
  5. 【Centos】重启后docker安装的容器端口无法访问的问题
  6. 【题解】P2324[SCOI2005] 骑士精神
  7. 英雄联盟晋级赛时服务器维修,英雄联盟段位机制改动曝光,晋级赛被坑或将成为历史...
  8. Centos7——将网卡修改为任意名称
  9. curl 实现qq挂号登录
  10. 关于《后浪》的B站弹幕分析总结(四)——Python实现LDA内容主题挖掘及主题可视化