晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

现在的AI是神经网络的天下,但科学家们正在尝试将神经网络与“老式AI”结合。

这里说的“老式AI”是上世纪70年代流行的“符号主义”。在几十年前遭遇失败后,“连接主义”取代其成为主流。

但是,越来越多的科学家注意到,将二者结合才会让AI发挥出更强大的威力。

让连接主义给符号主义“打工”

几年前,科学家从小鸭子身上学到了一样不寻常的东西。如果小鸭子出生后先看到的是两个相似的物体,那么之后会对相似物体产生更多的偏好。

小鸭毫不费力地做的事情对于人工智能来说是很难的,尤其是深度神经网络这一AI分支。

如果交给符号AI,它会怎么做?符号AI会处理物体的名称作为知识库,并给“相似”做出定义作为命题。

凭借其知识库和命题,符号AI采用推理引擎的逻辑规则来回答问题。

但符号AI缺点在于,要实现更复杂的推理需要庞大的知识库(人工构建),如果AI遇到知识库中没有的形状将无法处理。

连接主义利用知识进行训练,让神经网络具有学习能力,但容易受到对抗攻击。

于是将符号主义和连接主义结合起来的混合式神经-符号AI(neurosymbolic AI)应运而生。

科学家用深度神经网络来构建符号AI所需的知识库和命题,省去了人工预设的难题,然后使用符号AI对任务进行推理。

解决李飞飞2016年难题

2016年,李飞飞等人提出了组合语言和基本视觉推理(CLEVR)数据集,要求AI回答由计算机生成的简单3D形状图像相关问题。

使用复杂的深度神经网络可以解决此问题。但是,IBM、MIT和DeepMind的研究人员提出了一种截然不同的解决方案,显示出符号AI的强大能力。该方法相关论文已经被ICLR 2019收录。

在这篇论文中,他们将问题分解为符号AI熟悉的较小部分。

这套系统首先查看图像并表征3D形状及其属性,由此生成知识库。然后,它将问题变成一个可以在知识库上运行并产生答案的符号程序。

过去,在符号AI中,需要让人类程序员去手动输入知识库,现在研究人员希望由神经网络代替人类这项工作。

他们先通过使用卷积神经网络(CNN)解决了第一个问题,识别目标的颜色、形状、材质等属性。

然后使用递归神经网络(RNN)发现顺序输入中的模式。这个模块负责接收自然语言问题并将其转换为符号程序形式的问题。

整个过程类似于按需生成知识库,并让推理引擎在知识库上回答问题。

最终,这种混合AI在从未见过的问题和图像上进行测试,准确率达98.9%,击败了人类。人类只能回答正确92.6%的问题。

更好的是,混合AI只需要纯粹深度神经网络训练数据的10%。混合AI还具有可解释性,如果发生错误,则更容易发现问题所在。

挑战更高难度

搞定CLEVR数据集后,现在神经-符号AI正在解决更为棘手的问题。

2019年,在李飞飞CLEVR数据集的基础上,DeepMind、MIT、哈佛大学和IBM设计了一个更加复杂的挑战CLEVRER:让AI基于视频而不是图像来回答问题。

视频中会出现CLEVR数据集中的目标类型,但是这些目标会移动甚至发生碰撞,而且问题更加棘手。

有些问题是描述性的,比如:视频结束时有多少金属物体在移动?

有些问题则需要预测,比如:接下来将发生哪个事件?[a]绿色圆柱体和球体碰撞,[b]绿色圆柱体与正方体碰撞。

甚至还有些问题是视频中没有发生的(反事实),比如:没有青色圆柱体,将不会发生什么?[a]球体和立方体碰撞, [b]球体和青色圆柱体碰撞, [c]立方体和青色圆柱体碰撞。

对于当今的深度神经网络来说,这种随时间变化的因果关系是非常困难的,这主要表现在发现数据的静态模式方面。

为了解决这个问题,团队扩充了之前解决CLEVR的方案。

首先,神经网络学习将视频片段分解为目标的逐帧表示,然后被馈送到另一个神经网络,学习分析这些目标的运动以及它们如何相互影响,并可以预测目标的运动和碰撞。

这两个模块共同构成了知识库。其他两个模块处理问题并将其应用于生成的知识库。

该团队的解决方案在回答描述性问题方面的准确性约为88%,对于预测性问题的准确性约为83%,对于反事实问题的准确性约为74%。

让AI学会提问

提出好问题是机器在人类的另一项技能。这是一种不断学习世界的方式,而不必等待大量的样本。没有任何一种机器可以接近人类提问的能力。

而神经-符号AI展现出了这方面的能力。

纽约大学Brenden Lake助理教授和他的学生Wang Ziyun构建了一种混合AI,来玩一种需要主动提问的游戏——海战棋(Battleship)。

海战棋是一种猜谜式的攻防游戏,一方在棋盘上隐藏自己的“战舰”(长度不等),另一方负责攻击。

攻击方可以翻看某个方块下是否有“战舰”的一部分,或者直接向对方提问:“船有多长”、“所有三艘船的尺寸都一样吗”,诸如此类的问题 。以此来猜测船只的位置。

Lake和Wang分别用两种不同方式来训练游戏AI。

一种是监督学习,向神经网络展示棋盘和人类提出的好问题。最终神经网络学会了提问,但是很少有创造力。

另一种是强化学习。在这种训练中,每当神经网络提出一个有助于找到战舰的问题时,就会得到奖励。

神经网络最终学会了提出正确的问题,既有用又富有创造力。

Lake以前曾使用纯粹的符号方法解决了该问题,对于给定的棋盘状态,符号AI必须在巨大空间中搜索一个好问题,这让它变得极其缓慢。

但是,神经-符号AI的速度非常快。经过训练后,深度神经网络在产生问题方面远远胜过纯粹的符号AI。

下一步:自动驾驶

MIT-IBM Watson AI实验室的David Cox团队希望将这种混合AI用于自动驾驶技术。

自动驾驶AI需要神经网络经过训练来识别其环境中的物体,并采取适当的措施。如果神经网络在训练中做错了什么,例如撞到行人,就会受到惩罚。

另一位小组成员Nathan Fulton解释这种机制:“为了学会不做坏事,它必须做坏事,体验过那些坏事,然后在做坏事之前找出30个步骤,防止自己陷入困境。”

因此,AI学习安全驾驶需要大量的训练数据,而这些“坏事”让AI很难在现实世界中训练出来。

Fulton和他的同事正在研究一种神经-符号AI方法,克服这种局限性。AI的符号部分对现实世界的某些危险行为做出限制,来约束深度网络的行为。

从一开始就排除某些选择,这种简单的符号干预大大减少了训练AI所需的数据量。

“如果智能体不需要遇到一堆坏状态,那么它就只需要更少的数据,”Fulton说。

尽管该项目仍未准备好在实验室外使用,但Cox设想了一个未来,具有神经-符号AI的汽车将可以在现实世界中学习,而符号组件将成为防止不良驾驶的保障。

原文地址:
https://knowablemagazine.org/article/technology/2020/what-is-neurosymbolic-ai

论文地址:
https://arxiv.org/abs/1910.01442

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

AI落地最佳参考!

2020中国人工智能年度评选结果揭晓

12月16日,量子位MEET 2021智能未来大会现场,50大领航企业、10大明星创业公司、30大商业领军人物、10大最佳产品、10大最佳解决方案、5大社会责任榜样、5大最佳技术社区等年度奖项悉数颁出。

点击图片查看完整榜单:

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

让神经网络给符号AI“打工”,MIT和IBM联合解决深度学习痛点,未来将用于自动驾驶...相关推荐

  1. MIT深度学习课堂开课啦,自动驾驶圈大牛排队来讲课丨资源

    郭一璞 假装发自 Cambridge,MA  量子位 报道 | 公众号 QbitAI 伴随着新年的钟声,MIT深度学习课堂又开课了. 1月份的课程表已经安排上了,在四个星期的时间内,将会有6.S094 ...

  2. 从2019 AI顶会最佳论文,看深度学习的理论基础

    2020-01-27 13:15:38 如果能有一种理论告诉我们什么样的模型架构.运算方式能最好地表示某种数据,什么样的损失函数.迭代方式能最高效地学习到某种能力,什么样的设置又使这种能力能处理各种意 ...

  3. MIT课程全面解读2019深度学习最前沿 | 附视频+PPT

    夏乙 发自 凹非寺 量子位 出品 | 公众号 QbitAI 人类公元纪年2019年伊始,深度学习技术也同样处在一个新的"开端",宜review.宜展望. MIT正在进行中的深度学习 ...

  4. 人工智能(AI)的模式识别、机器学习和深度学习

    人工智能(AI)的模式识别.机器学习和深度学习 模式识别(pattern recognition).机器学习(machine learning)和深度学习(deep learning)代表三种不同的思 ...

  5. AI:人工智能领域之AI基础概念术语之机器学习、深度学习、数据挖掘中常见关键词、参数等5000多个单词中英文对照(绝对干货)

    AI:人工智能领域之AI基础概念术语之机器学习.深度学习.数据挖掘中常见关键词.参数等5000多个单词中英文对照(绝对干货) 导读      本博主基本收集了网上所有有关于ML.DL的中文解释词汇,机 ...

  6. 【AI初识境】近20年深度学习在图像领域的重要进展节点

    文章首发于微信公众号<有三AI> [AI初识境]近20年深度学习在图像领域的重要进展节点 这是专栏<AI初识境>的第3篇文章.所谓初识,就是对相关技术有基本了解,掌握了基本的使 ...

  7. 人工智能AI:TensorFlow Keras PyTorch MXNet PaddlePaddle 深度学习实战 part1

    日萌社 人工智能AI:TensorFlow Keras PyTorch MXNet PaddlePaddle 深度学习实战 part1 人工智能AI:TensorFlow Keras PyTorch ...

  8. AI Studio 飞桨 零基础入门深度学习笔记6.3-手写数字识别之数据处理

    AI Studio 飞桨 零基础入门深度学习笔记6.3-手写数字识别之数据处理) 概述 前提条件 读入数据并划分数据集 扩展阅读:为什么学术界的模型总在不断精进呢? 训练样本乱序.生成批次数据 校验数 ...

  9. AI Studio 飞桨 零基础入门深度学习笔记1-深度学习的定义

    AI Studio 飞桨 零基础入门深度学习-笔记 人工智能.机器学习.深度学习的关系 机器学习 机器学习的实现 机器学习的方法论 案例:牛顿第二定律 确定模型参数 模型结构介绍 深度学习 神经网络的 ...

最新文章

  1. JBOSS优化--比较有用的生产环境配置
  2. GeoPandas 笔记: GeoDataFrame.plot()
  3. 科大星云诗社动态20211201
  4. Linq To Sql 练习
  5. 指针和指针的指针_网络上的iPad指针
  6. 基于xml技术的操作
  7. 2018.8.26 Spring自学如门
  8. 2 使用_索尼黑卡RX100M6的使用指南2
  9. 操作系统知识点大总结【进线程管理与调度】
  10. fullPage最后一屏自适应
  11. mediasoup server 启动失败排查
  12. 《密码编码学与网络安全》William Stalling著---学习笔记(一)【知识点速过】【传统密码+经典对称加密算法+经典公钥密码算法+密码学Hash函数】
  13. 如何修改网络游戏服务器端的数据,网络游戏服务器端编程:数据操纵语句
  14. 可视化框架、Axure原型、大屏可视化、图表组件、图表元件库、统计图表、数据可视化模板、条形图、折线图、散点图、时间轴、仪表盘、饼图、散点图、雷达图、高山图、登录模板、弹窗、弹幕、预警、散点图
  15. Mssql2k之数据库管理
  16. java.lang.IllegalArgumentException异常
  17. 梦之旅游戏攻略html5,《梦之旅1:梦境》攻略
  18. html svg文件 热区,前端常识 【svg+热区】处理平面图
  19. 2015年c语言等级考试题1 10 2分,全国计算机等级考试二级c语言真题题库1+2015年9月.docx...
  20. Linux、MacOS本地调用STF远程设备(stf.sh、stf-connect.js、stf-disconnect.js)

热门文章

  1. Maven找不到要运行的JUnit测试
  2. 抽象工厂和工厂设计模式之间有什么区别?
  3. 测试向量是否包含给定元素
  4. 简单易用且功能丰富的纯Swift下载框架
  5. 如何在Java 环境下使用 HTTP 协议收发 MQ 消息
  6. ALM11需求和测试覆盖率图解1
  7. 【算法与数据结构】B-树学习笔记
  8. 有种软件你不得不备着,那就是数据恢复类软件
  9. Qt学习之路(29): 绘图设备
  10. mac pycharm打不开解决方法