北京站 | NVIDIA DLI深度学习培训
2018年1月26日

NVIDIA 深度学习学院 带你快速进入火热的DL领域
阅读全文                          

正文共2615个字,6张图,预计阅读时间7分钟。

大家好,我叫张拳石,UCLA博士后。目前在朱松纯老师的实验室,带领一个团队,做explainable AI方向。本文的题目有些大,这篇短文中,我只简单谈谈个人对deep learning发展状况的感受,和我最近的explanatory graph for CNNs和interpretable CNN两个研究课题。希望大家批评指正。

当deep learning刚刚在CV圈子里面兴起的时候,我并没有第一时间给予足够的关注,直到几个月后,变革的巨浪拍下,旧方向消亡的速度和新技术诞生的节奏都大大超过我的预期。相信很多人都有类似的感觉。一方面,deep learning超强的performance终结了一批旧的算法。另一方面,相比于传统graph-based methods,deep learning大大降低了算法多样性,简化了算法设计的复杂度。一时间,做CV研究的思路变得非常清晰:设计一个新的loss,提出一个新的网络结构,把传统的heuristic方法hard encoded到网络结构中去实现端对端学习。一两项技术能够把CV领域改造到这种地步,deep learning为AI带来巨大的改变。

然而当端对端学习神经网络犹如烈火烹油迅速发展的时候,我和周围的很多学者不时的会感觉到一丝的隐忧:端对端的训练一个black-box model会一直平稳的向下发展吗?随着网络结构和loss function的设计越来越复杂,神经网络真的会按照设计老老实实的去表达人们希望它表达的知识吗?抱着这样的焦虑,很多学者致力于visualization of CNN knowledge,让CNN中每个unit的知识清晰的展现在人们的面前。更进一步,@周博磊定义出一系列标准去评测CNN知识的interpretability。

但是归根结底,在端对端学习之外,我觉得还需要找到一套新的神经网络操作工具,即让神经网络具有清晰的符号化的内部知识表达,去匹配人类自身的知识框架,从而人们可以在语义层面对神经网络进行诊断和修改。从logic-based专家系统,到graphical model,再到深度神经网络,模型的flexibility和performance逐渐提高。

但是,从相反的方向,把一个神经网络的内部逻辑转化成graphical representations,或者logic-based rules,从而提高知识表达的interpretability。有了清晰的内部表达,那么对神经网络的训练是不是不但可以end-to-end,而且可以end-to-middle,middle-to-middle?当网络内部一些单元具有了某种语义,那么transfer learning是不是直接在语义层面指派就好了,不需要大数据去训练了?当网络训练可以深入到网络的内部语义,或许deep learning未来的发展会有更多的可能性。

我希望一个CNN不仅仅告诉我它在某张图像上检测到一只小鸟,我还要CNN明确的告诉我,它用第一个filter去监测鸟头,第二个filter去检测鸟尾巴。因为这两个filter被这张图像触发,所以判断出图像中有一只小鸟。进一步,当我知道鸟的分类得分是0.7,我还希望CNN给出鸟头部分贡献了0.3的分数,鸟尾贡献了0.2。当CNN内部逻辑足够条理清晰,我们是否还需要通过大数据进行端对端的训练?我们能否在语义层面直接debug CNN呢?

沿着这条思路,在“Interpreting CNN knowledge via an Explanatory Graph”一文中,我主要介绍了如何把一个CNN(pre-trained for object classification)的conv-layer内部知识转化成一个graphical model。算法自动学习出一个explanatory graph with tens of thousands of nodes去解释CNN内部的hierarchical知识结构。Explanatory graph中每一个node,严格表示在CNN中某个conv-layer的某个object part pattern。这样我就可以把混乱的CNN的知识拆分成几十万个object parts的子patterns。每个子pattern有很强的可迁移性(transferability),比如在multi-shot part localization的上可以降低1/3—2/3的误差。

进一步,基于explanatory graph语义化的表达,我们能否把传统的graph-based technologies自然的融入CNN的学习之中呢?我不知道。

在另一篇文章"Interpretable Convolutional Neural Networks"中,我介绍了如何端对端的学习一个CNN,使得其内部高层conv-layer的每个filter自动的表示某个object part。算法并不需要人为的标注object parts或texture作为额外的supervision,而是为这些filters添加一个prior constraint,使得在训练过程中自动回归的某种object part。

我还会写两篇短文分别专门介绍这两篇文章的技术细节。

在时代的巨浪下,deep learning未来将向哪里发展?我不知道。我只能带着一颗敬畏的心,摸着石头过河,边走边瞧吧。

可解释性与deep learning的发展 https://zhuanlan.zhihu.com/p/30074544

原文链接:https://www.jianshu.com/p/7e35eff851a0

查阅更为简洁方便的分类文章以及最新的课程、产品信息,请移步至全新呈现的“LeadAI学院官网”:

www.leadai.org

请关注人工智能LeadAI公众号,查看更多专业文章

大家都在看


LSTM模型在问答系统中的应用

基于TensorFlow的神经网络解决用户流失概览问题

最全常见算法工程师面试题目整理(一)

最全常见算法工程师面试题目整理(二)

TensorFlow从1到2 | 第三章 深度学习革命的开端:卷积神经网络

装饰器 | Python高级编程

今天不如来复习下Python基础

可解释性与deep learning的发展相关推荐

  1. Deep Learning回顾#之LeNet、AlexNet、GoogLeNet、VGG、ResNet

    CNN的发展史 上一篇回顾讲的是2006年Hinton他们的Science Paper,当时提到,2006年虽然Deep Learning的概念被提出来了,但是学术界的大家还是表示不服.当时有流传的段 ...

  2. Deep Learning回顾之LeNet、AlexNet、GoogLeNet、VGG、ResNet

    from:#Deep Learning回顾#之LeNet.AlexNet.GoogLeNet.VGG.ResNet CNN的发展史 上一篇回顾讲的是2006年Hinton他们的Science Pape ...

  3. CV视觉论文Deep learning学习笔记(一)

    论文介绍和监督学习(introduction of paper and supervision of learning) 1. 论文介绍和作者介绍 作者:论文作者是2018年图灵奖得主yoshua B ...

  4. 几何深度学习(Geometric Deep Learning)技术

    几何深度学习(Geometric Deep Learning)技术 几何深度学习综述 从论文Geometric Deep Learning: Grids, Groups, Graphs, Geodes ...

  5. Data Mining 论文翻译:Deep Learning for Spatio-Temporal Data Mining: A Survey

    原文链接:[1906.04928] Deep Learning for Spatio-Temporal Data Mining: A Survey (arxiv.org) IEEE Transacti ...

  6. Deep Learning论文笔记之(八)Deep Learning最新综述

    Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...

  7. 基因序列 深度学习Deep Learning for Genomics: A Concise Overview

    基因组学所需的数据量如此巨大,用深度学习技术去探索人类基因组密码便成为了趋势与未来. 由卡耐基梅龙大学硕士岳天溦与Eric Xing教授的学生汪浩瀚合著的论文"Deep Learning f ...

  8. 机器学习(Machine Learning)深度学习(Deep Learning)资料(Chapter 2)

    机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2) - tony的专栏 - 博客频道 - CSDN.NET 注:机器学习资料篇目一共 ...

  9. 活体检测综述 Deep Learning for Face Anti-Spoofing: A Survey 阅读记录

    论文链接:Deep Learning for Face Anti-Spoofing: A Survey | IEEE Journals & Magazine | IEEE Xplore 代码链 ...

最新文章

  1. 简析TCP的三次握手与四次分手【转】
  2. 【VirtualBox】NAT模式下主机访问客机的设置
  3. C++ Primer 5th笔记(3)字符串、向量和数组:向量vector
  4. iview tooltip自动消失_惠州广日自动人行道价格大概多少
  5. [redis] 分布式 Redis 的 CRUD 实现
  6. java 多线程 notify_Java多线程8:wait()和notify()/notifyAll()
  7. Matlab导出高DPI图像——生成高分辨率.eps .tiff .jpg
  8. 游戏场景设计文档案例_产品经理、设计、运营入门与进阶(132本书籍+需求文档+案例)...
  9. 在CSS中clear属性的妙用
  10. 疫情之下,计算机仿真程序告诉你,没事别乱出门!企业复工务必做到八个“一”...
  11. 12306ByTicket1.1操作手册
  12. 第九章 虚拟内存 第八节 内存映射
  13. ReactNative实现仿微信或者通讯录快速索引功能
  14. 琵琶行----白居易
  15. 酷派大神F1-救砖详细教程! 酷派8297w(大神F1联通版) 恢复官方兼救砖
  16. ppt密码忘了怎么解除,ppt权限密码怎么解开?
  17. 折腾小记(***+云盘选择+个人环境配置)
  18. css常见的几种布局
  19. 3d虚拟VR实训教学软件制作
  20. Cinema 4D(一):初识C4D

热门文章

  1. tp5微信公众号获取用户openid_tp5+微信公众号获取用户基本信息
  2. win10 .net framework 3.5 安装报错 0x800F0954问题
  3. java 10进制转2进制递归算法_十进制转二进制
  4. jupyter notebook python环境_jupyter Notebook环境搭建
  5. 财务管理属于计算机网络,浅谈如何应用计算机网络进行财务管理
  6. linux光盘运行iso,如何在Windows,Mac和Linux上从光盘创建ISO文件 | MOS86
  7. mysql 并发避免锁表_Yii+MYSQL锁表防止并发情况下重复数据的方法
  8. poj1845 Sumdiv 题解报告
  9. Git 常用命令[持续更新...]
  10. AngularJs 中ngModel绑定HTML5 date数据同步问题