来源:科技导报 

概要:谷歌DeepMind 团队的研究将认知心理学和深度神经网络结合在一起,并发现两者在小样本词汇学习过程中具有相似之处——DNN 和脑神经网络都具有形状偏好,相关研究论文《Cognitive psychology for deep neural networks: A shape bias case study》被国际机器学习学会(IMLS)收录。

谷歌DeepMind 团队的研究将认知心理学(cognitive psychology)和深度神经网络(deep neural network,DNN)结合在一起,并发现两者在小样本词汇学习(从一个示例中猜出一个单词的意思,one-shot word learning)过程中具有相似之处——DNN 和脑神经网络都具有形状偏好(shapebias),相关研究论文《Cognitive psychology for deep neural networks: A shape bias case study》被国际机器学习学会(IMLS)收录。深度学习和神经科学的学科交叉对未来的发展方向具有很强的指导意义,这项研究也为DNN 的机理以及脑神经网络的理论基础研究提供了一种可行的解决思路,而真正破解DNN 和脑神经科学的黑箱问题依然任重道远。

两个黑箱问题

DNN 在很多复杂任务上取得了前所未有的进展,如人脸识别、围棋以及Atari游戏,但是其解决方案也远远超出了我们的理解范围,成为了一个名副其实的黑箱。这种黑箱模型在很大程度上能够简单便捷地解决许多实际问题,但是从科学研究和实际应用的角度上看,我们需要理解并改变世界,只有破解DNN 的黑箱问题之后,才能更好地运用并改善该模型,同时提升实际应用中的可靠性。

在这种黑箱问题背景下,建立更加优秀而且可理解的神经网络系统成为一个热门的研究方向。许多研究者都认可:DNN 的图像处理模型与动物的视觉处理通路具有相似之处,动物的视觉处理通路存在感受野、方向选择性以及分级处理等特性,而模仿动物视觉信息处理的DNN 也具有类似的特性;此外,DNN的快速发展也促进了视觉神经科学方面的研究,形成了有效的正反馈;从更加宏观的角度来看,感受野、方向选择性、分级处理这些特性也会使DNN 和动物视觉信息处理在更高层次上具有一定的相似性。这种共同点以及两者相互促进的机制正是开展DNN 黑箱问题与认知心理学的交叉研究的基础。破解DNN 黑箱问题,首当其冲的是为该问题建立一套完整的问题描述方法及实验研究方法;由于DNN 与脑神经网络存在一定的共性,因此DNN 黑箱问题与脑神经科学的交叉研究正是一种行之有效的方法。尽管脑神经网络是一个更加庞大的黑箱,但是人们对于大脑的解码走在DNN黑箱问题的前面,对大脑的研究已经建立了一套系统的研究方法,这套研究方法也可以作为DNN 黑箱问题的基础。

DNN 与脑神经网络的异同点

认知心理学是研究脑神经网络的一门重要学科,认识心理学中一个经典的案例是考察儿童如何识别和标识物体,探索儿童如何从一个示例中猜出一个单词的意义;认知心理学的研究成果表明,儿童会通过采用归纳偏好来消除许多不正确的推理,而且形状偏好强于颜色偏好。在人工智能中,能够进行小样本学习的深度神经网络(matching network),凭借一个孤立样本,就取得了ImageNet 图像分类任务中目前最佳性能,而且该模型也更倾向于形状偏好。小样本学习的能力和形状偏好特性是DNN 与脑神经网络的共性,但是DNN和大脑终究就是两个差异很大的模型,一点小的共性难以弥补两者之间的鸿沟。

首先,DNN 和大脑的拓扑结构有很大的差别,DNN 往往具有非常规则的连接,而真实的脑神经网络之间的连接极其复杂,而且不同物种的脑神经网络连接也会有所不同;如大小鼠、猫和猴存在感受野以及视觉信息分级处理的机制,但是大小鼠没有功能柱,而猫和猴存在功能柱(具有相同感受野并具有相同功能的视皮层神经元,在垂直于皮层表面的方向上呈柱状分布);猫和狗的视锥细胞非常少,对颜色不敏感,猴和树鼩则具有丰富的颜色视觉;青蛙和兔子这类的低等动物的视觉信息处理系统对运动的物体非常敏感;每一类生物在漫长的进化过程中,都已经形成了最适应其生存环境的形态结构,而目前DNN 模型的拓扑结构与任何一种生物的神经网络结构都相去甚远。此外,DNN 的计算方式与大脑的信息处理方式也有很大不同,DNN 一般都是确定性的数学模型,给定输入之后,按照给定的计算流程,所有的中间变量以及最后的输出都是确定的;对于大脑来说,给定一个输入,会得到一个确定的输出,但是中间变量不是确定的(即每次看到一个苹果时,大脑会认出这是一个苹果,但是每次都只观察视觉信息处理过程中很小的一个神经环路时,这个环路的状态是变化的,而这种变化却不影响最终的输出)。从输入到输出,DNN 只有一条确定的路,而大脑每一次都走了一条不同的路,这就是DNN 的确定性与脑神经网络的不确定性之间的矛盾。

加强深度学习与脑科学交叉研究

DeepMind 团队认为这项形状偏好的研究表明:认知心理学工具具有揭示DNN 隐藏计算过程的能力,同时能够提供一个人类词汇学习的计算模型,对此我们持一定的怀疑态度。首先,DNN 和大脑的拓扑结构具有很大的差异,即使二者具有感受野、方向选择性、信息分级处理、以及形状偏好等形同特性,也并不能说明二者的计算过程有多少相似性;此外,学习和记忆也是认知心理学中亟待解决的黑箱问题,在得到透彻理解之前,并不能单方面地成为破解DNN 的黑箱问题的武器。值得肯定的是,深度学习与脑科学的交叉研究是未来必然的发展趋势;在2016 年,《Nature Neuroscience》上的一篇文章介绍了一种对更高层的视觉皮层的神经活动进行建模的目标驱动分层卷积神经网络(Goal-driven hierarchical convolutional neural networks,HCNNs),该研究表明目标驱动的HCNNs 能够揭示视觉皮层信息处理过程形成和发展的机理[2];神经科学和认识心理学并不是单纯的实验科学,只有基于DNN 这一类有效的理论分析方法,才能将二者推向更高的层次;从另一个角度看,随着对脑神经网络认识的深入,人们能够发掘出脑神经网络更多的特性,这些特性很有可能成为不断理解与完善DNN 模型的切入点,成为破解DNN黑箱问题的可行途径。

两个黑箱问题 ——深度神经网络和脑神经网络相关推荐

  1. 人机交互系统(1.2) ——深度神经网络(孪生网络)

    一.前言 深度神经网络通常比较擅长从高维数据中学习,例如图像或者语言,但这是建立在它们有大量标记的样本来训练的情况下.然而,人类却拥有单样本学习的能力--如果你找一个从来没有见过小铲刀的人,给他一张小 ...

  2. 第五章 深度神经网络为何很难训练

    原文 假设你是一名工程师,接到一项从头开始设计计算机的任务.某天,你在工作室工作,设计逻辑电路,构建 AND 门,OR 门等等时,老板带着坏消息进来:客户刚刚添加了一个奇特的设计需求:整个计算机的线路 ...

  3. 深度学习——卷积神经网络 的经典网络(LeNet-5、AlexNet、ZFNet、VGG-16、GoogLeNet、ResNet)

    1. CNN卷积神经网络的经典网络综述 下面图片参照博客:http://blog.csdn.net/cyh_24/article/details/51440344 2. LeNet-5网络 输入尺寸: ...

  4. 文档扫描:深度神经网络在移动端的实践

    随着深度学习算法在图像领域中的成功运用,学术界的目光重新回到神经网络上:而随着 AlphaGo 在围棋领域制造的大新闻,全科技界的目光都聚焦在"深度学习"."神经网络&q ...

  5. 清华博士后黄石生:深度神经网络实时三维重建和在线语义分割技术报告

    "走进高校" CARA 第二期学术讲堂:智能几何计算篇,直播已圆满结束.错过直播的小伙伴,福利来了,CV君已将回放视频整理完毕,欢迎收看! 第三 part,是黄石生老师的学术分享, ...

  6. 通过深度神经网络和树搜索掌握围棋游戏

    Article 作者:David Silver*, Aja Huang*, Chris J. Maddison etc. 文献题目:通过深度神经网络和树搜索掌握围棋游戏 文献时间:2016 发表期刊: ...

  7. 什么是深度学习?45分钟理解深度神经网络和深度学习 刘利刚教授

    什么是深度学习? - 45分钟理解深度神经网络和深度学习 刘利刚 中国科学技术大学图形与几何计算实验室 http://staff.ustc.edu.cn/~lgliu [绪言] 近年来,人工智能(Ar ...

  8. 深度神经网络全面概述:从基本概念到实际模型和硬件基础

    本文转载自:深度神经网络全面概述:从基本概念到实际模型和硬件基础 本文旨在提供一个关于实现 DNN 的有效处理(efficient processing)的目标的最新进展的全面性教程和调查. 作者:机 ...

  9. 【深度学习 论文综述】深度神经网络全面概述:从基本概念到实际模型和硬件基础

    本文转载自:深度神经网络全面概述:从基本概念到实际模型和硬件基础 本文旨在提供一个关于实现 DNN 的有效处理(efficient processing)的目标的最新进展的全面性教程和调查. 作者:机 ...

最新文章

  1. 模型与logit_互助问答第33期:条件logit模型相关问题
  2. win7磁盘清理_window7越来越卡?系统残余文件太多,磁盘清理可以搞定!!
  3. boost::hana::detail::create用法的测试程序
  4. 是否遇到过MySQL workbench text字段不能直接放入json格式内容
  5. OWASP Hakcing Lab在线漏洞环境
  6. 《JavaScript高级程序设计 第三版》学习笔记 (十三)高级函数
  7. lopatkin俄大神精简中英俄系统Windows 10 Home 18362.145 19H1 Release x86-x64 RU-EN-CN NANO
  8. 安全合规/ISO--1--ISO 27000系列标准介绍
  9. 自学-Linux-老男孩Linux77期-day6
  10. ps中基色 混合色 结果色是什么
  11. 【服务器托管单线、双线以及多线如何区别】
  12. 每天盯着桌面,送你几个4k、8k壁纸资源的网站,请收好
  13. Zeppelin解释器的REST API接口
  14. cobol-move语句
  15. java类型参数推断_Java泛型类型推断
  16. 数学建模与数据分析中的时间序列分析
  17. 万能实用工具箱微信小程序
  18. word中如何快速引用参考文献
  19. nyoj 144 小珂的烦恼
  20. html命名锚id name,Html5 锚 的页内跳转, name=abc herf=#abc | 易学教程

热门文章

  1. CS专业读PhD是否有意义?附CS奖学金项目清单
  2. 目标检测比赛中的trick
  3. SAP独门神器之VC变式配置,硬核整理版重磅推出!
  4. 谷歌公布GSoC 2020 暑期代码项目名单,200个开源项目30个新增
  5. 药企巨头辉瑞与家用机器人 Mabu 合作,利用 AI 评估患者行为
  6. 500万张图片,20万处地标风景,谷歌又放出大型数据集
  7. 深度学习NN、CNN、RNN、和DNN你了解吗?
  8. 科技贡献新力量:无人驾驶清扫车上路
  9. 一文读懂AI简史:当年各国烧钱许下的愿,有些至今仍未实现
  10. 诗人般的机器学习,ML工作原理大揭秘