点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ★,与你不见不散

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:量子位

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

神经网络就像“炼丹炉”一样,投喂大量数据,或许能获得神奇的效果。

“炼丹”成功后,神经网络也能对没见过的数据进行预测了~

然而,这种情况下,神经网络其实成了“黑匣子”——具有一定的功能,但看不见是怎么起作用的。

如果只做简单的图像分类,其实还好;但如果用在医学方向,对疾病进行预测,那么神经网络下的“判断”就不可轻信。

如果能了解它是怎么工作的,就更好了。

出于这种考虑,来自牛津大学的博士生Oana-Maria Camburu撰写了毕业论文《解释神经网络 (Explaining Deep Neural Networks)》。

在这篇论文中,她将这些“黑匣子”一个个打开,对神经网络原理进行了详细的解释。

为什么要打开神经网络“黑匣子”?

事实上,神经网络之所以起作用,最直观的原因就是,它由大量非线性函数组成

这些非线性函数,使得网络可以学习原始数据中各种抽象级特征。

然而,也正是因为神经网络中的这些非线性函数,使得人类往往难以理解,它们是如何起作用的。

这就导致神经网络在疾病预测、信用额度、刑法等方向上“不太受欢迎”。

医生和法律相关的研究者往往更乐意采用可解释模型,例如线性回归、决策树,因为神经网络在疾病预测中的确出过问题:

人们利用神经网络预测肺炎患者的病情发展,其中一项患者特征为是否有哮喘病史

神经网络经过训练后预测,有哮喘病史的患者死于肺炎的可能性较低。

但其实结果恰好相反,哮喘本身会给肺炎带来雪上加霜的效果。

之所以数据表明哮喘患者较少死于肺炎,往往是因为哮喘能被及早发现,所以患者得肺炎后能被及早治疗。

如果这种神经网络被应用于实践中,将会带来非常危险的结果。

此外,即使是神经网络,也会对男女性别产生刻板印象、产生种族偏见。

例如,调查表明,有些语料库和模型,在预测再犯时,会更“偏爱”男性。

除了错误的预测和种族、性别歧视以外,神经网络还很脆弱

无论是对图像进行小改动欺骗分类算法、还是用语音识别瞒过NLP模型,神经网络被“爆雷”的情况也不少。

为了让神经网络应用于更多的方向,也为了让我们更好地学习它的原理,作者从两个方向对神经网络进行了解释。

2种方法解释神经网络

“事后再解释”

第一种方法,称之为基于特征的解释方法,又叫“事后再解释”——因为这种方法,是在神经网络训练好后,才对其输入特征进行解释的。

这种方法针对文本的词(token)、或是针对图像的超像素(super pixels),进行“事后”解释。

目前这种方法应用较为普遍,不容易出现解释偏见,但需要验证解释方法的真实性。

这里的根本原理,是研究外部解释方法给出的解释、与模型本身生成的自然语言解释之间,是否存在相关性,而相关性具体又是什么。

在论文中,作者引入了一种新的验证方法,来判断解释方法的真实性。

让神经网络自己解释

那么,如果能让神经网络一边训练、一边“解释自己”呢?

这是论文提到的第二种方法,即在模型中植入一个生成预测解释的模块,对预测的结果进行解释。

至于神经网络对自己的解释是否正确,还需要人为进行判断。

在这里面,作者同样引入了一种判断方法,对模型自己生成的解释进行判断,从而得出神经网络解释的结果。

对神经网络详细结构、具体解释方法感兴趣的小伙伴,可以戳下方论文地址查看~

作者介绍

Oana-Maria Camburu,来自罗马尼亚,目前是牛津大学的博士生,主修机器学习、人工智能等方向。

高中时期,Oana-Maria Camburu曾获IMO(国际奥数竞赛)银牌。她曾经在马普所、谷歌实习,读博期间,论文被ACL、EMNLP、IJCNLP等顶会收录。

论文地址:
https://arxiv.org/abs/2010.01496

end

这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 

目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟

王博的公众号,欢迎关注,干货多多

王博的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章(上)

博士笔记 | 周志华《机器学习》手推笔记第八章(下)

博士笔记 | 周志华《机器学习》手推笔记第九章

点个在看支持一下吧

神经网络“炼丹炉”内部构造?牛津大学博士小姐姐用论文解读相关推荐

  1. 神经网络“炼丹炉”内部构造长啥样?牛津大学博士小姐姐用论文解读

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 神经网络就像"炼丹炉"一样,投喂大量数据,或许能获得神奇的效果. "炼丹"成功后,神经网络也能对没见 ...

  2. 模块说和神经网络学说_让神经网络解释自己:牛津大学博士小姐姐,用毕业论文揭示“炼丹炉”结构...

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 神经网络就像"炼丹炉"一样,投喂大量数据,或许能获得神奇的效果. "炼丹"成功后,神经网络也能对没见 ...

  3. 困扰数学家50年的问题,竟被博士小姐姐用一周业余时间解决了

    晓查 贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一个多月前,著名英国数学家约翰·康威(John Conway)因患新冠肺炎逝世. 斯人已逝,但他留给了世界丰富的知识遗产,最知名的莫 ...

  4. 打破校史!这位参与发表学校首篇Science的博士小姐姐,近日一作再发Nature

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要13分钟 Follow小博主,每天更新前沿干货 本文来源:科研大匠综合自西南交大新闻网.官微.扬华研究生新闻中心 转载自:募格学术 导读: 1 ...

  5. 21天的你长这样?剑桥博士小姐姐研究「人造胚胎」,2篇Nature到手

    白交 发自 凹非寺  量子位 报道 | 公众号 QbitAI 已经开始「人造胚胎」了,这可能是21天的你. △实验室合成胚胎(18天-21天)的模型,伪彩扫描电子显微镜照片 最近,Nature发表的一 ...

  6. MIT博士小姐姐的机器学习入门教程开课!碎片时间服用,每周一更 | 资源

    铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 厌倦了千篇一律的机器学习教学课程怎么办?没有太多时间预算怎么学? 来点不一样的. 现在,两位MIT博士小姐姐搞了一套机器学习入门教程ML T ...

  7. 单身博士小姐姐转行互联网的面试之旅

    点击上方蓝色字体,关注我 -- 一个在阿里云打工的清华学渣! 关于程序猿石头(ID: tangleithu):阿里技术专家,清华学渣,前大疆后端 Leader,欢迎关注,交流和指导!后台回复 &quo ...

  8. 【AI学院】有三AI博士小姐姐带你学深度学习之图像识别下篇,附上篇回顾

    带学营第一期(上)圆满结束回顾 有三 AI 深度学习之图像识别带学营第一期(上)圆满结束,这一期我们主要的培训内容是深度学习基础+项目实战(人脸表情识别和鸟类细粒度识别). 以上的课程可以说是干货满满 ...

  9. 科研人的暑假:学长下地中暑,博士小姐姐留校养鱼......

    前几天在网上看见一个好笑又心酸的投稿,"原定于今晚八点浙大学长的植物生理学公开课,因为学长下地中暑了....下地中暑了.... 就延期了...." >>>> ...

最新文章

  1. html暗边框属性,HTML表格标记教程(30):单元格的暗边框色属性BORDERCOLORDARK
  2. PHP各种实用的开源库推荐
  3. Cloud for Customer的工作中心(work center)加载源代码
  4. string concat_Java String concat()方法与示例
  5. java 多线程的同步问题_java多线程解决同步问题的几种方式,原理和代码
  6. MTK6589 电话号码匹配改成11位出错
  7. 【第115期】零基础学做游戏制作_搭环境Unity hub
  8. 计算机原理 复位信号解释,复位电路原理
  9. HR问:“你为什么离开上一家公司?”,这样回答最机智
  10. 《结构思考力》如何把200ml的水倒入100ml的杯子里?
  11. python小白社区_Python小白教学系列| 初识python-Go语言中文社区
  12. rk3288[android 6.0] 调试串口修改为普通串口
  13. neo4j图形数据库Java应用
  14. 考研复试怎么穿搭?看这一篇就够了!
  15. 常见的 ChatGPT 相关错误提示及解决办法
  16. IT技术开发人员获得成功的六大步骤
  17. MCP2515 CAN芯片调试说明
  18. Ios html 离线浏览,离线iOS应用的HTML 5制作指南(2)
  19. oracle创建导入数据库,unix下手动创建oracle以及imp数据导入
  20. python一键导出百度网盘目录文件

热门文章

  1. java dom 获得子元素_在JavaScript中删除DOM节点的所有子元素
  2. python哪个专业开这个课程-深圳python课程
  3. 市面上有哪几种门_市面上常见的木门种类有哪些呢?
  4. usr bin java快捷方式_/ usr / bin / sudo必须由uid 0拥有并设置setuid位
  5. c++和c语言的区别_C与C++傻傻分不清楚,有啥区别,咋用,杂学?
  6. 专利翻译常用计算机词汇,基于NP树的英文专利文献术语自动翻译技术研究-计算机应用技术专业论文.docx...
  7. 数据挖掘肿瘤预测_喜欢临床预测模型|SEER数据挖掘的期刊有哪些
  8. 陕西省高等数学竞赛_关于参加“陕西高校第十二次大学生高等数学竞赛”的通知...
  9. 语言兔子繁衍问题讲解_颍湄脞録兔子不搁那窝里
  10. 微信小程序 mpvue 获取元素的高度