转自公众号:专知

【导读】ICLR2019上主要集中在解决深度学习中的四个主要挑战:公平,安全,普遍性和因果关系。 我们已经讨论了当前状态下的机器学习算法是如何有偏见的,容易受到对抗性攻击的影响,以及他们在多个应用程序的训练数据集中找到的模式概括的能力极其有限。 现在,研究界正忙于努力使技术足够复杂以减轻这些弱点。

因果关系

机器学习非常适合在数据中找到相关性,但是它能否找出因果关系? 这样的成就将是一个巨大的里程碑:如果算法可以帮助我们阐明复杂系统中不同现象的原因和影响,它们将加深我们对世界的理解并解锁更强大的工具来影响它。知名研究员LéonBottou(现在Facebook的人工智能研究部门和纽约大学)设立了一个新的框架,他正在与合作者一起研究如何实现这一目标。

思考因果关系的新方法

Bottou和他的团队的第一个重要思想:一种思考因果关系的新方法。 假设您想构建一个识别手写数字的计算机视觉系统。你将在大量的手写数字图像上训练一个神经网络,每个图像用它们代表的数字标记,最后得到可以发现用于识别以前从未见过数字的新系统。

但是,假设训练数据集略有修改,每个手写数字也被涂上红色或绿色。

假设你不知道是颜色还是形状影响了分类结果,简单地整张图片并将它们输入神经网络,用于预测最后的数字

事情变得有趣。 “有色MNIST”数据集会误导模型。回到现实世界,我们知道标记的颜色与其内容完全不相关,但在这个特定的数据集中,颜色才起了主要的作用,而不是形状。因此,我们的神经网络学习使用颜色作为主要预测因子。当我们使用网络识别遵循相同着色模式的其他手写数字时,这完全没问题。但是当我们颠倒数字的颜色时,表现完全不行。 (当Bottou和他的合作者用真实的训练数据和真实的神经网络进行这个思想实验时,他们在前一种情况下获得了84.3%的识别准确率,在后者中获得了10%的准确性。)

换句话说,神经网络发现了Bottou所谓的“虚假相关”,这使得它在训练它的狭窄环境之外完全无用。从理论上讲,如果你能够摆脱机器学习模型中的所有虚假关联,那么你将只留下“不变”的那些 - 无论上下文如何都是如此。

Bottou解释说,不变性反过来会让你理解因果关系(我个人的理解是红色的数字1和蓝色的数字1,给定预测label:1,网络学到的不变性是字形而不是颜色)。如果您知道系统的不变属性并知道在系统上执行的干预,您应该能够推断出干预的后果。例如,如果您知道手写数字的形状总是决定其含义,那么您可以推断改变其形状(原因)会改变其含义(效果)。另一个例子:如果你知道所有物体都受到万有引力定律的影响,那么你可以推断出当你放开一个球(原因)时,它会落到地上(效果)。

显然,这些是基于我们已经知道的不变属性的简单因果实例,但想想我们如何将这个想法应用于我们还不了解的更复杂的系统。例如,如果我们能够找到经济系统的不变属性,那么我们能够理解实施普遍基本收入的效果怎么办?或者地球气候系统的不变属性,我们可以评估各种地球工程的影响吗

摆脱虚假的相关性

那么我们如何摆脱这些虚假的相关性呢?这是Bottou团队的第二个重要创意。在当前的机器学习实践中,默认的直觉是将尽可能多的多样化和有代表性的数据聚集到单个训练集中。但是Bottou说这种方法有害。来自不同背景的不同数据 - 无论是在不同时间,在不同位置还是在不同实验条件下收集 - 应该作为单独的集合而不是混合和组合来保存。当它们合并时,就像现在一样,重要的上下文信息会丢失,从而导致虚假相关的可能性更高。

对于多个特定于上下文的数据集,训练神经网络是非常不同的。网络没必要找到一个单独的训练数据集中成立的相关性;它必须找到所有不同数据集中不变的相关性。如果从各种情境中巧妙地选择这些集合,那么最终的相关性也应该与地面实况的不变性质紧密匹配。

让我们再一次回到我们简单的彩色MNIST示例。利用他们寻找不变属性的理论,Bottou和合作者重新开始他们原来的实验。这次他们使用了两个彩色的MNIST数据集,每个数据集都有不同的颜色模式。然后,他们训练他们的神经网络,以找到两组之间保持一致的相关性。当他们在具有相同和反色图案的新数字上测试这个改进的模型时,它们两者的识别准确率达到70%。结果证明神经网络已经学会忽视颜色并仅仅关注标记的形状

Bottou说他的团队在这些想法上的工作没有完成,研究界需要一些时间来测试比彩色数字更复杂的问题的技术。但该框架暗示了深度学习的潜力,以帮助我们理解事情发生的原因,从而使我们能够更好地控制自己的命运。

原文链接:

https://www.technologyreview.com/s/613502/deep-learning-could-reveal-why-the-world-works-the-way-it-does/

【转】用深度学习揭示数据的因果关系相关推荐

  1. 中科院DeepMind联手,用深度学习揭示大脑如何识别人脸|Nature子刊

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI Deep ...

  2. MATLAB中深度学习的数据集合

    简 介: 本文总结了部分MATLAB中用于深度学习的数据集合. 关键词: MATLAB,DEEPLENARING #mermaid-svg-xPWl4yTsAw5Z4HFe {font-family: ...

  3. DL:关于深度学习常用数据集中训练好的权重文件(Deeplab v3、MobileNet、InceptionV3、VGG系列、ResNet、Mask R-CNN )下载地址集合(持续更新)

    DL:关于深度学习常用数据集中训练好的权重文件(Deeplab v3.MobileNet.InceptionV3.VGG系列.ResNet.Mask R-CNN )下载地址集合(持续更新) 目录 基于 ...

  4. 仿真的数据能否用来深度学习_数字孪生弥合了深度学习的数据鸿沟

    点击上方"蓝色字体",选择 "设为星标" 关键讯息,D1时间送达! 随着企业开始使用可将其数据投入使用的深度学习(DL)项目,他们必须保护这些数据,而数字孪生是 ...

  5. 深度学习训练数据打标签过程

    深度学习训练数据打标签过程 为了获取大量的图片训练数据,在采集数据的过程中常用视频的方式采集数据,但对于深度学习,训练的过程需要很多的有有标签的数据,这篇文章主要是解决视频文件转换成图片文件,并加标签 ...

  6. 毕业设计-基于深度学习的数据融合方法研究

    目录 前言 课题背景和意义 实现技术思路 一.深度学习概述 二.基于深度学习的数据融合方法分类 1.基于深度学习特征提取的数据融合方法 2.基于深度学习融合的数据融合方法 3.基于深度学习全过程的数据 ...

  7. 深度学习——day38 读论文:基于深度学习的数据竞争检测方法(DeleRace计算机研究与发展 2022)

    基于深度学习的数据竞争检测方法 chap0 Introduction 本文贡献: 原文及笔记下载 chap1 DeleRace 1.1 检测框架 1.2 选取实际应用程序 1.3 特征提取 1.3.1 ...

  8. PNAS | 基因调控之深度学习揭示免疫细胞分化的调节机制

    今天给大家介绍的是加拿大不列颠哥伦比亚大学和哈佛大学.加拿大CIFAR AI高级研究院合作发表在PNAS的一篇论文.作者借助深度学习中的卷积神经网络提出一个训练网络" AI-TAC" ...

  9. 【Python】深度学习中将数据按比例随机分成随机 训练集 和 测试集的python脚本

    深度学习中经常将数据分成 训练集 和 测试集,参考博客,修改python脚本 randPickAITrainTestData.py . 功能:从 输入目录 中随机检出一定比例的文件或目录,移动到保存 ...

  10. 吴恩达深度学习ppt_【深度学习】吴恩达谈深度学习:数据科学家需要知道这些...

    数据科学家需要什么深度学习知识?吴恩达 (Andrew Ng)用机器看图说话,机器问答等实例告诉大家.本文是吴恩达在2015年12月在ExtractConf上的演讲摘录,含20分钟视频与ppt. An ...

最新文章

  1. [转]mysql 数据类型
  2. matlab中float类型的_【Python基础学习】2. 变量、基本数据类型及其转换
  3. python右对齐 数字_如何在Python中右对齐数值数据?
  4. 不从事编程、学python有用吗-没想到,学会Python即使不做程序员都能月入过万!...
  5. 百度Logo月度首页人物--王正华:中国低成本航空第一人
  6. WayOs路由器WAN口帐号保存工具,可直接发送至邮箱,及保存接口VLAN号
  7. MySQL的索引存储数据结构BTree和B+Tree的区别
  8. 【华为云技术分享】处理器存储模型概述(2)
  9. NYOJ96 - n-1位数
  10. Vue.js 学习笔记 十二 Vue发起Ajax请求
  11. tomcat-内存溢出java.lang.OutOfMemoryErrory:PermGen space解决方法
  12. exxi6.7如何传文件到win7_win7系统被删除文件如何恢复 恢复被删除的文件操作方法【详解】...
  13. linux工程常用的应用命令总结:
  14. bat篇---windows bat启动exe结尾的可执行程序
  15. 微商推广引流秘笈—— 8 个高效的引流策略
  16. HTML + CSS 实现购物商城小米(提供源码下载)
  17. 【Excel】Excel 等办公软件不能复制内容到其他区域
  18. 【报告分享】小红书·新消费浪潮下的决策价值之地-小红书(附下载)
  19. java:定义USB接口
  20. 论坚持的力量-知耻后勇

热门文章

  1. 【0CTF/TCTF2021预选】[Misc] pypypypy Sloth writeup python字节码编程
  2. C/C++软件工程师就业求职手册学习笔记---第五章
  3. android 对称加密完毕,通过 Android keystore 和 fingerprint 结合实现数据加密和解密
  4. 多个txt文件合并成一个txt文件、多个csv文件合并成一个csv文件
  5. 嗖嗖移动大厅之使用场景类
  6. win10 安装程序显示“为了对电脑进行保护,已经阻止此应用” 管理员已阻止你运行此应用
  7. 打开ps显示计算机内存不足怎么办,ps显示内存不足怎么办,教你ps显示内存不足怎么办...
  8. 第三模块 商务写作的“5步法”
  9. 有趣的设计模式——两脚插头也能使用三孔插板
  10. markdown特殊符号语法