https://www.toutiao.com/a6665945564028338699/

人工智能的世界是什么样的?

几十年来,研究人员一直对此感到困惑。现在,人们更加想知道这个问题的答案。尤其是,从医疗保健到自动驾驶汽车,越来越多的生活领域开始应用机器视觉系统。而且这些领域直接和人的生命息息相关。

但是让机器眼睛真正“看到”谁是行人谁是路标,仍然是一个挑战。做不到这些可能会产生严重甚至致命的后果。

现在,谷歌和著名人工智能研究机构 OpenAI 的一项新研究有望改变这种情况。他们正通过绘制一些系统来感知世界的视觉数据,从而进一步打开人工智能视觉的黑匣子。这种被称为“Activation Atlases”的方法让研究人员可以分析各种算法的工作原理,不仅揭示了他们识别的抽象形状、颜色和图案,还揭示了他们如何将这些元素结合起来识别特定的物体、动物和场景,堪称在计算机视觉领域又一次重要的打开黑箱的尝试。

“这感觉像是创造了一个显微镜。”这项工作主要负责人、来自谷歌的 Shan Carter 如此说道。

图丨用 Activation Atlas 处理 GoogLeNet 视觉算法的一系列模板(图片:Google / OpenAI)

如果将先前的研究比作视觉算法字母表中的单个字母,那么 Activation Atlases 则更接近于整个字典,它显示了字母是如何组合在一起构成实际单词的。

这项工作不一定是一个巨大的突破,但它在“特征可视化(feature visualization)”这一更广泛的研究领域中向前迈出了一步。佐治亚理工学院的博士生 Ramprasaath Selvaraju 没有参与这项工作,他表示,这项研究“非常令人着迷”,它结合了许多现有的想法,创造了一个新的“非常有用”的工具。

Selvaraju 表示,在未来,这样的工作将有很多用途,它可以帮助我们建立更高效、先进的算法,还能让研究人员进入内部来提高算法的安全性并消除算法偏见。Selvaraju 说:“由于神经网络固有的复杂性,它们缺乏可解释性”。但他表示,在未来,当神经网络经常用于驾驶汽车和引导机器人时,这种解释性将是必要的。

OpenAI 的 Chris Olah 也参与了这个项目,他说:“至少,这就是我们所追求的目标。“

图丨 Activation Atlases 能让研究人员描绘算法用于理解世界的视觉数据。(来源:OpenAI / Google)

激活神经元

要了解 Activation Atlases 和其他功能可视化工具的工作原理,首先需要了解一下 AI 系统是如何识别对象的。

AI 系统识别对象的基本方法是使用神经网络:一种与人类大脑大致相似的计算结构(它在复杂性方面远远落后于人脑)。在每个神经网络内部是一层像网状物一样连接的人造神经元。像人类大脑中的细胞一样,这些神经元会响应刺激,这一过程称为激活。重要的是,它们不仅可以开启或关闭,它们还会在光谱上注册,并为每次激活赋予特定值或“比重”。

要将神经网络变为有用的东西,用户必须提供大量的训练数据。以视觉算法为例,这将意味着数十万甚至数百万的图像,而且每个图像都要标记有特定的类别。而谷歌和 OpenAI 的研究人员测试的神经网络,训练数据则更加广泛:几乎所有东西都有涉及。

图丨神经网络使用一层相互连接的人工神经元来处理数据。不同的神经元对图像的不同部分起作用(来源:OpenAI / Google)

当神经网络处理数据时,神经网络中的不同神经元会因响应不同图像而亮起,并通过这种模式连接到图像的标签。正是通过这种关联,神经网络才能“学习”事物的样子。神经网络经过训练后,用户就可以向它展示以前从未见过的图片,并且能激活神经元,然后将用户的输入与特定类别相匹配。

但是,像许多机器学习程序一样,视觉算法本质上只是模式匹配而已。这给了它们一定的优势(例如,只要你拥有必要的数据和计算能力,就可以直接进行视觉算法训练)。但它们也有某些弱点,例如它们很容易被之前从未见过的输入陷入混乱。

研究人员在 2010 年初发现了神经网络在处理视觉任务方面的潜力,他们一直在完善相关研究,试图弄清楚神经网络是如何做的。

早期的一项实验是 DeepDream 程序,这是 2015 年发布的计算机视觉程序,它能将任何图片变成幻觉版本。DeepDream 的视觉效果肯定是有趣的,比如在某些方面,它定义了人工智能美学,但该程序也是算法的早期尝试。“某种程度来说,这一切研究都始于 DeepDream 程序,”Olah 说。

图丨像 DeepDream 这样的图像让机器学习算法尽可能有趣(来源:OpenAI / Google)

DeepDream 所做的是将图像调整为尽可能有趣的算法。这就像是软件在图像中发现“隐藏”的图案,又更像是有人在着色书中涂鸦:用眼睛,画笔,螺纹和颜料填充每一寸画纸。

后来的研究采用了同样的基本方法,并对其进行了微调:首先针对神经网络中的单个神经元,并弄清楚是什么激发了它们,然后是神经元群,之后是神经网络中不同层的神经元的组合。如果早期的实验是偶然但专注的,那么最近的工作更有针对性。通过绘制神经网络的每个部分中激活的视觉元素,积少成多,最终就得到了整个图集:神经网络的视觉索引。

(来源:OpenAI / Google)

机器的视角

但是,Activation Atlases 实际上向我们展示了算法内部运作方式的什么内容?你可以先在谷歌和 OpenAI 的例子中进行理解,它们能为我们展示著名的 GoogLeNet(也叫 InceptionV1)神经网络的内部世界。

测试地址:https://distill.pub/2019/activation-atlas/

滚动鼠标,您可以看到神经网络的不同部分如何响应不同的概念,以及这些概念如何聚集在一起。(例如,狗和鸟类在不同的地方)你还可以看到神经网络的不同层代表不同类型的信息。较低级别的神经层相对抽象,响应基本的几何形状,而较高级别的神经层将解析可识别的概念。

当你深入研究个别分类时,就会变得有趣。谷歌和 OpenAI 给出的一个例子是“潜水管”和“潜水员”之间的区别。

在下图中,你可以看到神经网络用于识别这些标签的各种激活活动。左边是与“潜水管”密切相关的激活响应,右边是与“带水肺的潜水员”密切相关的激活响应。中间的激活响应在两个类之间共享,而条纹上的那些则有更多的差异。

图丨与“潜水管”(左)和“带水肺的潜水员”(右)相关的激活响应。(来源:OpenAI / Google)

我们可以一目了然地看出一些明显的颜色和图案。在顶部,看起来像鱼的鲜艳斑点和条纹,而在底部,有看起来像是面具的形状。但右侧突出显示了一种不寻常的激活响应,与蒸汽机车密切相关的激活响应。研究人员对此感到困惑,为什么这些关于机车的视觉信息对识别潜水员很重要?

“所以我们测试了它,”Carter 说。“我们想,'好吧,如果我们输入一个蒸汽机车的图片,是不是会识别为带水肺的潜水员图片分类或潜水员分类图片?'现在看来确实如此。”

图丨三个图像显示了如何重新分类相同的图片。在左边,它被确定为潜水员分类; 中间,随着机车图片的增加,它变成了带水肺的潜水员分类; 当机车足够大时,它变成了机车分类。(来源:OpenAI / Google)

该团队最终找到了原因:这是因为机车的光滑金属曲线在视觉上类似于潜水员的空气罐。因此,对于神经网络来说,这是带水肺的潜水员和潜水员之间的一个明显区别。为了节省区分这两个类别的时间,它只是从其他地方借用了所需的识别视觉数据。

这种例子出人意外地揭示了神经网络的运作方式。而对于怀疑论者,它揭示了这些系统的局限性。他们表示,视觉算法可能是有效的,但他们学到的信息实际上与人类如何理解世界无关。这使他们容易受到某些诡计的影响。例如,如果将一些精心挑选的像素投射到图像中,可能就足以使算法对其进行错误分类。

但对于 Carter、Olah 和其他研究人员来说,Activation Atlases 和类似工具所揭示的信息显示了这些算法的惊人深度和灵活性。例如,Carter 指出,为了使算法区分带水肺潜水员和潜水员,它还将不同类型的动物与这两个类别联系起来。

“在深水中像海龟一样的动物,被分为 scuba 类,地面上出现的鸟类一样,被分为 snorkel 类,”他说。他指出,这是系统从未指导学习的信息。相反,它是自学的。“这有点像是神经网络对世界更深刻的理解。这真的很令人兴奋。“

研究人员希望通过开发这样的工具,将有助于推动人工智能整个领域的发展。通过了解机器视觉系统如何看待世界,理论上我们可以更有效地构建它们并更彻底地检查它们的准确性。

“现在的人工智能是一个有局限的工具箱,”Olah 说。他表示,我们可以在系统上用测试数据来试图欺骗它们,但这种方法总是受到我们的认知限制。“Activation Atlases 给了我们探索未知问题的新工具,感觉每一代人工智能工具都让我们更接近真正理解这些神经网络中正在发生的事情。”

谷歌、OpenAI 做了一个“魔性AI显微镜”,打算撬开人工智能黑箱相关推荐

  1. 大开眼界:Facebook做了一个会“开眼”的AI,拯救眨眼照片

    郭一璞 发自 雨中的海淀  量子位 报道 | 公众号 QbitAI 端午的三天假期,你们是不是都穿得帅帅美美的出去浪了? 既然出门了,一定要拍照发朋友圈(尤其是拍女朋友,要修图,划重点). 想象一下, ...

  2. 专访元知科技崔兴龙:这位十几年前就在做AI研究的“谷歌老兵”,现在已经把AI用在了12个赛道上...

    允中 发自 凹非寺 量子位 报道 | 公众号 QbitAI 人工智能,正在改变许多行业. 从交通到工业,从零售到推荐,这些被AI改变的行业无疑都有一个共同特点:标准化,结构化. 但非标的行业,也被人盯 ...

  3. 利用谷歌AIY小纸盒,外国妹子做了一个人脸“晴雨表”!

    AI和机器学习概念正在以惊人的速度增长. 对这些发展感兴趣的人需要一种有效实践和实施这些技术的方法. 幸运的是,Google让我们更容易深入人工智能世界. 随着他们的AIY套件的发布,我们现在能够创建 ...

  4. 谷歌搞事情:最先被AI淘汰的,居然是做AI的?

    坊间流传着这么一个说法:谷歌想回中国,必须靠AI:而靠AI回中国,必须搞个大事情.于是,上周四的晚上李飞飞发布了一篇博客,然后连着发了三条推特,宣布一个叫AutoML的AI产品启动了. 一夜之间,中国 ...

  5. 美团副总裁夏华夏:科技应该为每一个普通人服务,要做“接地气的AI” | MEET2021...

    编辑部 整理自 MEET 2021 量子位 报道 | 公众号 QbitAI 站在2020年岁末,AI技术渗透进生活的方方面面,成为技术变革之大势,已经成为人们的共识. 但是,怎样的科技应用,才能让前沿 ...

  6. OpenAI总裁Brockman丨从AI门外汉到影响全世界,难以复刻的创业,值得借鉴的人生...

    今天,OpenAI总裁兼董事长Greg Brockman等人官方发文称,OpenAI正式发布ChatGPT API,允许开发者将该技术集成到他们的应用程序中.Greg Brockman是OpenAI团 ...

  7. 美国新闻集团拟起诉微软谷歌OpenAI;大厂核心技术人员开启创业潮;京东云首次发布数智平台“优加”丨每日大事件...

    ‍ ‍数据智能产业创新服务媒体 --聚焦数智 · 改变商业 企业动态 美国新闻集团拟起诉微软谷歌OpenAI 自ChatGPT风靡全球后,AI版权问题就成为近来国外争论不休的一个焦点.据报道,AI技术 ...

  8. 10行Python,搭建一个游戏AI | 视频教程

    昨天为大家推荐了三个Python视频,包含:<利用Python,用4分钟时间搭建一个情感分析系统>.<7行Python代码,搭建一个可以识花的机器学习APP>.<10行P ...

  9. 第22天:如何使用OpenAI Gym和Universe构建AI游戏机器人

    by Harini Janakiraman 通过哈里尼·贾纳基拉曼 第22天:如何使用OpenAI Gym和Universe构建AI游戏机器人 (Day 22: How to build an AI ...

最新文章

  1. jQuery.fn和jQuery.prototype区别。
  2. SOP,TSSOP,PLCC,BGA这些封装的中英文解释
  3. XCTF-Web-高手区-shrine
  4. java 线程池的理解_JAVA线程池原理的理解
  5. 【Flink】Flink 资源相关 Slot SlotPool
  6. 从编写到上线带你搞定springboot博客之编辑博客时新增标签02
  7. html滑动门原理,HTML+CSS:雪碧图和滑动门制作
  8. 数学建模论文写作——框架和要点
  9. vb中换行的几种方法
  10. 系统容量评估和性能保障
  11. 孪生再世代表数字几_孪生(27)_亦舒_梦远书城
  12. 面对满天繁星似的知识.如何做到老虎吃天
  13. 男女朋友关系是这么确定的。。。【其实相爱很简单】
  14. android 百度地图驾车导航,百度地图API详解之驾车导航
  15. 卷积核的优势-权值共享与局部感知能力
  16. Whistle使用手册
  17. win7系统损坏无法开机_win7系统网络适配器无法启动怎么办
  18. 极客日报:苹果承认从2019年开始扫描用户邮件寻找虐童资料;新浪回应“花钱买热搜”传闻;李沐斯坦福《机器学习》课程上线
  19. Altium Designer 入门学习 -- 放置导线与电气符号
  20. 【学术论文写作】03 从词汇过渡到语法

热门文章

  1. JAVA 基本类型传值,对象类型传引用
  2. 静态方法是一种特殊的成员方法,它不属于类的某一个具体的实例。
  3. 尤雨溪携手字节前端专家,畅聊 Vue 3.0 前端技术新趋势
  4. Fabrice Bellard:一个人抵得上一个百人团队
  5. 超分辨率:将背景和人脸分离 ,人脸、背景分别做增分后将人脸贴回背景图
  6. 设置cl.exe环境变量
  7. 深度学习时代,调包侠没有未来,但是这个“包”有
  8. 独家 | 2020年22个广泛使用的数据科学与机器学习工具(附链接)
  9. 赠票 | 中国数据智能管理峰会(上海)
  10. 干货 | 顾险峰:对抗生成网络的几何理论解释(附视频PPT)