神经网络如何告别黑箱,可解释?
来源:pythonic生物人
本文约1000字,建议阅读9分钟
本文带你用光学系统类比深度学习。
神经网络黑箱的意思是我们知其然,不知其所以然,相关理论比较缺乏。别看神经网络相关论文汗牛充栋,但是大部分类似于technical report,告诉你我这么做效果不错,具体原因不知道,只能“guess”,所以很容易被打脸。
如何看待神经网络的黑箱?这一篇文章(www.argmin.net/2018/01/25/optics/)讲得挺好的,他用光学系统类比深度学习,非常形象。
「从结构来看」,无论是深度学习还是镜头,都是一层一层叠起来的,如下图所示。
「从设计流程来看」,当要设计一个镜头的时候,往往以一个已知的镜头组合作为基础,这个已知的镜头组合一般都以发明这个镜头组合的人命名,类似于深度学习的里面的LeNet、AlexNet。然后你跑个仿真,看看这个基础镜头组合的表现和你需要达到的要求存在哪些差距,在合适的地方插入合适的组件来磨平差距。接着,你用一个[数值优化器]来调上述镜头组合的参数,以发挥上述镜头组合最大的功效。这个类似于深度学习里面的优化和调超参过程。
「从系统组成部件来看」,光学组件有的起到反射作用,有的起到衍射作用,有的起到[折射作用],有的起到散射作用,有的起到相位校正作用等等。
深度学习组件(conv、pool、relu等等)有的起到学习空间相关作用,有的起到防止过拟合作用,有的起到增加非线性作用等等。
「从发展历史来看」,伽利略时代虽然没有光学理论,类似于现在的深度学习,但是同样造出来了人类历史上第一架天文望远镜,推动了天文学的发展。现在深度学习也理论不足,但是极大地推动了人工智能的发展。
「从结果看」,在几百年里,经过科学家的不懈努力,光学终于形成了一整套比较完备的体系,使得现在的光学工程师在设计镜头的时候有迹可循,而不是像几百年前的伽利略一样靠经验设计。
这一套完备的体系将光学分层了,如下图所示,这样的分层使得光学分工明确,每个人研究各自层的东西,一起推动光学发展。上面的层是下面层的抽象,越往上能解释越复杂的现象,见下图所示,而相比而言深度学习里面的很多现象还得不到较好的解释。
光学也经历过黑箱时代,深度学习现在就是黑箱时代,理论的前进一般会晚于实践,但是假以时日,理论肯定会完备起来,形成类似于当前光学那样的层层抽象的学术体系,只不过这个过程需要所有从业者一起的努力,和一定时间的积淀,也许几十年,也许上百年。
编辑:黄继彦
神经网络如何告别黑箱,可解释?相关推荐
- r语言 tunerf_R语言机器学习:caret包使用及其黑箱模型解释(连续变量预测)
原标题:R语言机器学习:caret包使用及其黑箱模型解释(连续变量预测) 作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘.社交网络分析和机器学习等.希望与大家分享学习经验,推广并加深R语言在业界 ...
- 模块说和神经网络学说_为什么都说神经网络是个黑箱?
神经网络黑箱的意思是我们知其然,不知其所以然,相关理论比较缺乏.别看神经网络相关论文汗牛充栋,但是大部分类似于technical report,告诉你我这么做效果不错,具体原因不知道,只能" ...
- 干货丨卷积神经网络工作原理的直观解释
正文之前先插播一条广告: 依依的姐妹们自己创建了一个公众号,她们是一群痛并快乐着的懒妈,每天一起分享孕娃.生娃.养娃过程中的酸甜苦辣咸的文章,公众号刚刚创建,大家帮忙关注一下,捧一捧人场!依依在此谢谢 ...
- 卷积神经网络工作原理直观的解释?
查看全部 35 个回答 YJango 1 日本会津大学 人机界面实验室博士在读 741 人赞同了该回答 该文是卷积神经网络--介绍,并假设你理解前馈神经网络. 如果不是,强烈建议你读完如何简单形象又有 ...
- 关于神经网络的正确说法,可解释的神经网络模型
有人可以介绍一下什么是"神经网络"吗? 由于神经网络是多学科交叉的产物,各个相关的学科领域对神经网络都有各自的看法,因此,关于神经网络的定义,在科学界存在许多不同的见解. 目前使用 ...
- 这可能是神经网络 LeNet-5 最详细的解释了!
大家好,我是红色石头! 说起深度学习目标检测算法,就不得不提 LeNet- 5 网络.LeNet-5由LeCun等人提出于1998年提出,是一种用于手写体字符识别的非常高效的卷积神经网络.出自论文&l ...
- 风控模型黑箱可解释,试下这个方法来演示
模型的开发,目前在互金领域场景中因为变量多,开发周期短,目前用得最多的就是XGB.LGB这类的机器学习模型. 比如我们之前跟大家输出的关于个人信贷反欺诈评分卡的开发内容里,我们用的就是lightgbm ...
- 神经网络 深度学习 专业术语解释(Step, Batch Size, Iteration,Epoch)
1. 名词解释 Step: 训练模型的步数 Batch Size(批尺寸): 计算梯度所需的样本数量,太小会导致效率低下,无法收敛.太大会导致内存撑不住,Batch Size增大到一定程度后,其下降方 ...
- 利用循环神经网络生成唐诗_可视化解释11种基本神经网络架构
> Source: Pixabay 标准,循环,卷积和自动编码器网络 随着深度学习的飞速发展,已经创建了完整的神经网络体系结构主机,以解决各种各样的任务和问题. 尽管有无数的神经网络架构,但对于 ...
最新文章
- AI 盯上了外包司机,看后视镜就被扣分,奖金拜拜!
- 哈佛最新成果:温度高于25℃可降低新冠病毒传染率,但不足以完全控制疫情...
- 爬虫 404 try_Python爬虫MOOC笔记
- pycharm 自动补全括号 引号
- Grafana文档(在Centos / Redhat上安装)
- 东北大学 计算机技术导师,报考东北大学 计算机技术 329分 求调剂相关专业
- Android 解压zip文件
- VUE ---- 利用vue-print-nb实现打印功能
- 一个屌丝程序猿的人生(四十九)
- matlab程序设计题题库及答案,matlab程序设计例题及答案
- Ue4导入视频黑屏原因
- 怎样花两年时间去面试一个人(转自MIND HACKS)
- 计算机专业论文评定意见,毕业论文评定意见(级).doc
- python语言中的转义字符_怎么使用Python转义字符
- Android 自定义字体
- pvs-stdio ue4_PVS-Studio –用于C,C ++,C#和Java的静态代码分析器
- ensp路由器注册_使用ensp进行简单的路由器互连实验
- limt mysql操作
- python剪切文件_python剪切文件 - osc_42713235的个人空间 - OSCHINA - 中文开源技术交流社区...
- 自适应随机图片背景导航页源码