浩楠 晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

两个月前轰动网络的AI设计大师CLIP,刚刚被OpenAI“扒开”了脑子。

没想到,这个性能强大的AI竟和人类思维方式如此相像。

打个比方,无论你听到“炸鸡”二个字,还是看到炸鸡实物,都可能流口水。因为你的大脑里有一组“炸鸡神经元”,专门负责对炸鸡起反应。

这个CLIP也差不多。

无论听到“蜘蛛侠”三个字,还是看到蜘蛛侠的照片,CLIP的某个特殊区域就开始响应,甚至原本用来响应红色和蓝色的区域也会“躁动”。

OpenAI发现,原来CLIP有一个“蜘蛛侠神经元”。

在脑科学中,这并不是啥新鲜事。因为早在15年前,研究人脑的科学家就发现了,一张脸对应一组神经元

但是对AI来说却是一个巨大的进步。过去,从文字到图像,和从图像到文字,用的是两套系统,工作方式都不一样。

而CLIP却有着和人脑极为相似的工作方式,CV和NLP不仅技术上打通,连脑子里想的都一样,还有专门的处理区域。

看到二者如此相像,有网友表示:

太可怕了,这说明通用人工智能(AGI)到来,比所有人想象的都快。

而且,OpenAI还惊讶地发现,CLIP对图片的响应似乎类似与癫痫患者颅内神经元,其中包括对情绪做出反应的神经元。说不定AI今后还能帮助治疗神经类疾病。

AI的“脑子”,其实和人类一样

先前情回顾一下,CLIP到底是神马。

不久前,OpenAI发布了脱胎于GPT-3的DALL·E,能按照文字描述准确生成图片。

DALL·E对自然语言和图像的理解和融汇贯通,做到了前无古人的水准。一经问世,立刻引来吴恩达、Keras之父等大佬点赞。

而DALL·E的核心部分,就是CLIP。

简单的说,CLIP是一个重新排序模型,检查DALL·E所有生成结果,挑出好的展现出来。

CLIP能做“裁判”,离不开将文字和图片意义“融合”理解的能力,但这样的能力从哪来,之前人们根本不清楚。

OpenAI紧接着深挖CLIP神经网络的原理结构,发现了它的多模态神经元,具有跟人类大脑类似的工作机制:能够对文字和图像中的相同意义同时做出响应

而所谓模态,是指某个过程或某件事,包含多个不同的特征,图像通常与标签和文本解释相关联,是完整理解一个事物的要素。

比如,你看到蜘蛛侠三个字,或者是Spiderman,都能联想起穿着红蓝紧身衣的超级英雄。

熟悉这个概念以后,看到这样一幅黑白手绘,你也能马上明白这是“蜘蛛侠”:

CLIP中的多模态神经元,能力与人类没有任何区别。

这样专门负责某个事物的神经元,OpenAI发现了好几个,其中有18个是动物神经元,19个是名人神经元。

甚至还有专门理解情绪的神经元:

其实,人本身就是一个多模态学习的总和,我们能看到物体,听到声音,感觉到质地,闻到气味,尝到味道。

为了让AI摆脱以往“人工智障”式的机械工作方式,一条路径就是让它向人一样能够同时理解多模态信号。

所以也有研究者认为认为,多模态学习是真正的人工智能发展方向。

在实现过程中,通常是将识别不同要素子网络的输出加权组合,以便每个输入模态可以对输出预测有一个学习贡献。

根据任务不同,将不同的权值附加到子网后预测输出,就能让神经网络实现不同的性能。

而具体到CLIP上,可以从研究人员的测试结果中清楚的看到,从语言模型中诞生的它,对于文字,比对图像更加敏感。

攻击AI也更容易了

但是,文字和图像在AI“脑海”中的联动是一把双刃剑。

如果我们在贵宾犬的身上加上几串美元符号,那么CLIP就会把它识别为存钱罐。

OpenAI把这种攻击方式叫做“印字攻击”(typographic attacks)。

这意味着,我们可以在图片中插入文字实现对AI的攻击,甚至不需要复杂的技术。

只需一张纸、一支笔,攻破AI从未如此容易。

苹果就这样被改装成了“苹果”iPod。

CLIP:iPod就是“苹果”产品,没错啊~

甚至还有网友把苹果改装成了图书馆。

中国网友应该更加熟悉,看来我们可以像用符咒封住僵尸一样封住AI。

在防止对抗攻击这件事上,CLIP还有很多工作要做。

AI黑匣子没那么黑

即便如此,“多模态神经元”依然是在AI可解释性上的重要进展。

可用性和可解释性就像鱼和熊掌。

我们现在用的正确率最高的图像识别模型,其可解释性很差。而可解释AI做出的模型,很难应用在实际中。

AI并不能满足于实用。AI医疗、无人驾驶,如果不能知其所以然,伦理道德就会受到质疑。

OpenAI表示,大脑和CLIP这样的合成视觉系统,似乎都有一种非常相似的信息组织方式。CLIP用事实证明,AI系统并没有我们想象的那么黑。

CLIP不仅是个设计大师,它还是一个开放大脑的AI,未来也许减少人工智能错误与偏见。

参考链接:
[1] https://openai.com/blog/multimodal-neurons/
[2] https://www.axios.com/openai-vision-recognition-system-bias-fadb191c-de0f-46c5-a5a8-ef5ae7421c9e.html

—  —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

点这里????关注我,记得标星,么么哒~

加入AI社群,拓展你的AI行业人脉

量子位「AI社群」招募中!欢迎AI从业者、关注AI行业的小伙伴们扫码加入,与50000+名好友共同关注人工智能行业发展&技术进展

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

首次发现!AI脑回路演化向人类更进一步,OpenAI最新研究引热议,有学者评价:太吓人了...相关推荐

  1. 最强写作AI竟然学会象棋和作曲,语言模型跨界操作引热议,在线求战

    十三 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一个搞文本生成的模型,还能用来干嘛? 好奇心很强的网友便拿OpenAI的GPT-2做了个实验. 原来,GPT-2除了能生成文本,竟然还 ...

  2. AI评委引热议,阿里巴巴表示:AI不会取代工程师

    昨日,一位能给工程师代码打分的"AI评委"引发了热议.起因是在2019阿里巴巴"83行代码挑战赛"决赛现场,一位运行在云端的AI评委和现场的专家评委.大众评委配 ...

  3. ​AI大事件 | 特斯拉开发人工智能芯片,智能爆炸论再引热议,Pytorch新版本发布

    呜啦啦啦啦啦大家好呀,又到了本周的AI大事件时间了.过去的一周中AI圈都发生了什么?大佬们互撕了哪些问题?研究者们发布了哪些值得一读的论文?又有哪些开源的代码和数据库可以使用了?文摘菌带你盘点过去一周 ...

  4. 国内首个“元宇宙”专业引热议:南京双一流高校推出,3年前刚成立AI学院

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 羿阁 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 一所&q ...

  5. 人类血液中首次发现微塑料颗粒,饮料瓶塑料袋化妆品都是来源

    梦晨 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 塑料不光污染环境,最终也污染了人类自己. 一则人类血液中首次发现微塑料的消息引发网友热议,一度登上知乎热榜第3,微博阅读量更是达到2.4亿. ...

  6. AI发现人类肾细胞有一半结构未知,UCSD最新研究登上Nature,算法已开源

    晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 我们的细胞再向下一级究竟有什么?细胞核.线粒体.内质网.高尔基体-- 在中学生物课里我们知道了这些,然而它们就是亚细胞结构的全部吗? 绝对不 ...

  7. 人工智能的发展历程,AI ,路在何方(文章分享)

    人工智能的发展历程,AI ,路在何方(文章分享) 详细请见原文,原文连接 相信有许多初入人工智能领域的朋友,像我一样,或多或少会对人工智能的历史.未来感到迷茫.当我读完这篇文章的时候,第一感觉是比较震 ...

  8. Nature封面:AI与人类斗嘴谁更强?IBM团队发布“AI辩论家”最新研究进展

    来源:学术头条.大数据文摘本文约4200字,建议阅读8分钟本文带你了解AI的辩论能力. 在很多游戏和围棋比赛中,人工智能(AI)都展现出了 "超人" 能力,现在,它又开始冲击辩论赛 ...

  9. 揭秘手机行业未来AI之路

    揭秘手机行业未来AI之路 在10月19日上午举办的IDC中国数字化转型年度盛典的"人工智能与大数据"分论坛上,IDC(国际数据公司,International Data Corpo ...

最新文章

  1. 互联网公司前端初级Javascript面试题
  2. [蓝桥杯2019初赛]数的分解-枚举
  3. LeetCode题目总结-滑窗法
  4. 支付宝回应 AI 换脸风险;新 iPhone 或将于 13 号接受预订;Linux Lite 4.6 发布 | 极客头条...
  5. HDU 5294 - Tricks Device(最短路+最小割)
  6. java统计误码率_MATLAB通信工具箱来计算误码率
  7. 【转载】2005中文博客排名报告
  8. 滴水逆向3期笔记与作业——01汇编
  9. iOS杂谈15—APP被苹果APPStore拒绝的各种原因
  10. OpenStack使用Placement做资源管理时虚拟机无法调度的一次排错记录
  11. java抠图人物背景图片_如何进行人物抠图?让你快速完成复杂背景人像的在线抠图...
  12. Oracle技巧:如何诊断一些未预料的 Oracle 错误(ORA-NNNN)
  13. PaaS,BLT模型中的一部分
  14. 计算机专业就业推荐表中求职意愿,毕业生推荐表的求职意愿怎么填啊?
  15. Flutter开发相比React-Native优势在哪里?高手为你答疑解惑!
  16. 【Copula】基于二元Frank-Copula函数的风光出力场景生成方法【考虑风光出力的不确定性和相关性】(Matlab代码实现)
  17. 开源神器:可快速在 iOS 设备上安装 Windows、Linux 等操作系统!
  18. 三维声技术在赛事直播中的应用,TWS耳机中音频技术落地实践,通话降噪算法落地应用及挑战...
  19. 2023年西安电子科技大学微电子学院集成电路工程专业考研经验分享
  20. http报文头部有哪些字段?有什么意义?

热门文章

  1. 如何在JavaScript / jQuery中查找数组是否包含特定字符串? [重复]
  2. 403禁止vs 401未经授权的HTTP响应
  3. 您如何计算字符串中字符串(实际上是字符)的出现?
  4. Metadata GC Threshold导致的full gc分析
  5. linux下安装php的imagick扩展模块(附php升级脚本)
  6. Java中泛型的各种使用
  7. UI仿写 - 收藏集 - 掘金
  8. macOS下nginx配合obs做推流直播.md
  9. JavaScript引用方法说明
  10. Ecshop文章列表页显示内容摘要