来源:ScienceAI

编辑:萝卜皮

多年前,AI 领域曾发生过一件荒唐而有趣的事情。

据说,研究人员开发了一种对医院数据进行训练的算法。这个算法发现,「患有哮喘的肺炎患者的治愈表现,比没有哮喘的肺炎患者更好」,因此这个算法向医院建议「不要收治那些患有哮喘的人」。之所以得出这种荒唐的结论,那是因为「它」没有理解出现「这种现象」的原因:患有哮喘的肺炎患者得到了额外的医疗照顾。

人类和动物认知的核心是对因果关系的理解:「事情为什么会发生」以及「我们如何影响世界」。几十年过去了,大多数人工智能仍然缺乏「识别数据中的模式和相关性」的这种能力。

如果不了解因果关系,AI 可能永远无法弄清楚很多事情(例如导致疾病的因素),我们可能也永远无法正确解释概括它(例如深度神经网络输出)。为 AI 提供因果推理,不仅可以使 AI 更具可解释性,而且还可以使 AI 更加稳健、公平,并且——也许是最深刻的——可概括。

为了达成这一目的,计算机科学家需要教计算机以一种新的方式看待世界:将世界看作由「潜在机制驱动」的现象,即使是在这些机制无法从数据中得出的情况下。

「我们正在采取科学假设并将其数学化。」

最近,哥伦比亚大学计算机科学副教授兼哥伦比亚因果人工智能实验室负责人 Elias Bareinboim 开发了一种方法。该方法用于决定,在一种环境中有效的干预措施是否适用于另一种环境,是一种广义智能。

如果我们知道医疗程序可以帮助一家医院的人,它可能会告诉我们该程序是否适用于不同的患者群体;如果我们知道机器人可以在加利福尼亚沙漠中航行,它可能会告诉我们机器人是否可以在火星上运行;它也可能告诉我们需要进行更多的实验。在特定数据集上训练的算法在实际部署应用时经常会失败,那是因为类似以上因果逻辑训练的缺失。提前发现此类问题,可以改进训练过程;也可以根据问题,建议限制人工智能在何时何地可以被信任。

Elias Bareinboim 哥伦比亚因果人工智能实验室负责人

一方面

总结经验教训是人类的老伎俩,Elias Bareinboim 也借鉴了人类的策略。「孩子们一种常见的学习方式是模仿成年人,」他说。最近他团队的工作揭示了,软件算法如何学会模仿专家,即使在没有观察指导专家行为的所有信息的情况下。

下面是一个非常重要的举例,请仔细阅读。

该团队的自动驾驶汽车模拟器通过无人机在上方飞行,使用来自道路的数据训练汽车。在培训期间,「学习者」(指控制自动驾驶汽车模拟器的算法)观察到一位专家在另一辆车后面驾驶。专家根据前方汽车的尾灯进行加速和制动。因为「学习者」看不到灯光,所以认为专家的行为似乎不正常,于是便停止了模仿。但是,当「学习者」被部署在环境中,从路上观察两辆车时;它发现到了辅助信息(两辆车的速度)的存在,这足以替代隐藏变量(尾灯),并用辅助信息来通知汽车模拟器继续模仿。新方法可以系统地搜索环境中的补充信息,从而了解行为的真正原因;这对于现实世界中的 AI 至关重要。

另一方面

概括智能的另一个关键是在系统中构建卓越的归纳推理。假设一个人想要预测一部电影能赚多少钱。我们可能会查看演员表,看看它是否包含大明星。但是,相关性不等于因果关系。其他的称为「混杂因素」的因素可能会影响演员阵容和收入。哥伦比亚大学统计学和计算机科学教授 David Meir Blei 研究了一种称为去混杂因素的方法,该方法在进行预测时解释了一些隐藏的混杂因素。

David Meir Blei 统计学和计算机科学教授。

下面是另一个非常重要的举例,请仔细阅读。

「去混杂因素」起源于全基因组关联研究,目的是利用基因预测性状或疾病。Blei 的见解是,为该方法提供正式的理由,并将其推广到其他领域。在 2019 年的一篇被高度引用的论文中,他表明,该方法可以作用于大型数据集,从而证明「基因对性状」、「吸烟对健康」和「演员对电影」收入的影响。Blei 的「解构者」(Blei 所提到的方法)在推荐系统、社会科学研究和医疗评估方面显示出了强大性能,该领域的许多研究者已经在应用该方法。

Blei 还帮助科学家建立「世界如何运作」的模型。他探索了如何在大型、复杂的数据集中找到模式,并通过假设变量之间的因果关系来使用它们来预测未来。

「我们正在采用科学假设并将其数学化。」他说。例如,他与统计系的副教授 John Patrick Cunningham  联同一组研究人员,正在绘制宇宙的尘埃图。尘埃是不可见的,一个隐藏的变量,影响观察到的变量,如恒星亮度。Blei 帮助科学家们开发了一个概率生成模型,然后将其反转,根据他们所看到的来构建尘埃图。

这就是因果机器学习的神奇之处:将机器学习的大规模能力与因果推理的原则性推理相结合。这将用于开发下一代人工智能技术。

相关报道:

https://magazine.engineering.columbia.edu/focus/ai/foundations/one-thing-leads-to-another

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

教AI区分因果关系和相关性,将改变下一代 AI 的研发相关推荐

  1. Jeff Dean亲自揭秘谷歌下一代AI架构:通用、稀疏且高效,网友不买帐:毫无新意...

    来源:机器之心本文约2500字,建议阅读5分钟 Jeff Dean 亲自撰文介绍他眼中的下一代 AI 架构 Pathways. 对谷歌的下一代 AI 架构,你怎么看? 在这波 AI 浪潮中,人工智能技 ...

  2. 智能连接:5G、AI和IoT的组合如何改变美洲

    来源:199IT互联网数据中心 摘要:GSMA发布了新报告"智能连接:5G.AI和IoT的组合如何改变美洲",强调了该地区如何从这些科技中受益.GSMA Intelligence预 ...

  3. 百万局对战教AI做人,技术解读FPS游戏中AI如何拟人化

    作者:johnxuan,腾讯 TEG 应用研究员 FPS 游戏 AI 是腾讯 AI Lab 的一大重要研究方向,其拟人化 AI 也在 FPS 手游<穿越火线-枪战王者(CFM)>春节期间上 ...

  4. ddr2是几代内存_教你区分DDR1 DDR2 DDR3内存条的方法

    DDR1,DDR2,DDR3内存条俗称的一二三代内存条,有什么区别呢?这三种内存条工艺不同,接口不同,性能不同,互不兼容.那么有什么办法可以快速区分DDR1 DDR2 DDR3内存条呢?其实区分它们不 ...

  5. 教你区分护照与签证的方法

    随着社会的不断发展,越来越多的人移民出国.关于移民出国过程中遇到的一些专业性问题可能很多人都不是那么清楚,那么接下来为大家介绍关于"护照"和"签证"的小常识,下 ...

  6. 双核跟四核的区别linux,双核和四核有什么区别?教你区分双核和四核的方法

    很多网友在讨论讨论电脑双核和四核有什么区别?我们都知道电脑CPU最重要的组成部分,CPU中心那块隆起的芯片就是核心.有些用户发现有的CPU型号虽然是双核,但是性能比四核好,那么双核和四核有什么区别?本 ...

  7. “AI教父”李开复筹办新公司,掘金 AI 2.0 三个大方向

    图片:由无界AI画图工具生成 3月19日,创新工场董事长兼CEO李开复在朋友圈宣布,正在筹组一个名为"Project Al 2.0"的新公司,一个旨在探索AI2.0的创新项目. 图 ...

  8. 从AI作画到AI做视频,这一跳改变了什么?

    九月初的时候,AI绘画作品<太空歌剧院>在美国获得了人类艺术竞赛一等奖的新闻让许多人震惊不已.许多人没有想到,画沙雕图的AI竟然这么快就技能进步到超越了人类.AI作画的时间从年初以小时为单 ...

  9. 手把手教你薅羊毛,1 元体验业内领先AI技术!

    双十一的套路早已看透,为何你还甘心成为"尾款人"在商家的层层套路中痛并快乐着.不要急-百度大脑 AI 产品双十一年终狂欢活动钜惠开启!无需尾款,没有套路,只有硬核低价. 百度大脑人 ...

最新文章

  1. Visual Studio 2005 2008 2010样式
  2. 关闭生成调试信息和嵌入清单
  3. Seata-AT 如何保证分布式事务一致性
  4. php恶意代码,php快速查找数据库中恶意代码的方法,快速查找恶意代码_PHP教程...
  5. C# 获取可执行文件路径的上上级目录的方法
  6. burp-intrude-Attack-type的使用介绍
  7. 移动端网页开发注意点
  8. HDF5数据模型介绍及h5py
  9. 判断端口是否能用_MSP430单片机的端口解析
  10. MySQL Err126错误[Err] 126 - Incorrect key file for table '.\device\table_name.MYI'; try to repair it
  11. 【wpa_supplicant】入门 eloop 机制
  12. mac word 2016中文输入问题解决
  13. AI大神Hinton再次“逃离”美国,成就了虎视眈眈的加拿大
  14. html里面点击重置按钮无反应,点击重置按钮后没反应.
  15. os.listdir(path)
  16. 阿里云生成支付二维码并支付前端实现
  17. hive中的内部表和外部表
  18. 英利分布式:国内最高光伏空调3大亮点引关注
  19. java面试大全(7w字,更新中)
  20. 【北风的第二次任务】

热门文章

  1. 使用wireshark分析TLSv2(详细)
  2. 【ICLR2022】序列生成的目标侧数据增强
  3. TC260-001《汽车采集数据处理安全指南》
  4. 数据蒋堂 | 最简单的大数据性能估算方法
  5. 清华大学何晓斌:未来人才培养是大数据、AI和人文社会科学的结合
  6. 无意中发现一位大佬的算法刷题pdf笔记
  7. 超越RetinaFace,腾讯优图 ASFD 已在 WIDER FACE 霸榜半年!
  8. 收藏 | 深度学习损失函数大全(附代码实现)
  9. 【汇总】一大波CVPR2020开源项目重磅来袭!
  10. 到2030年,人工智能会发展成什么样?