AI研究的盲点:无解的神经网络内在逻辑
论人工神经网络内在逻辑的研究历史及现状。
伴随着大数据,人工智能(AI)在沉寂了多年之后,又迎来了新的高潮。在这场涉及大部分科学的革命中,人工神经网络释放了人工智能(AI)。但科学家们发现,这一关键技术暗含着一个问题:人工神经网络就是一个“黑匣子”。
我们都知道,无论人工神经网络有多么复杂,都可以将其看作是三部分:输入层、输出层和隐含层。其中,我们通过深度学习,对神经网络进行一层一层的叠加训练,以此来有效调整神经网络各级神经元的权重。但是,这里有一个问题,除去输入和输出,我们对隐含层发生了什么一无所知,即对神经网络内部逻辑行为无从认知。
华盛顿大学的研究生Marco Ribeiro使用过一种叫做反事实探测的方法来了解这个“黑匣子”。此方法具体就是通过给输入一点微小的变化,随即查看输出的变化,并记录这些变化。但是很显然,这一方法需要上千次的操作和尝试,而且无法帮助我们全面认识人工神经网络。
而Google的另一位计算机科学家Mukund Sundararajan设计了一种探测器,大大减少了输入。不同于Ribeiro采取的随机输入, Sundararajan的研究创新点是引入一个空白的参考。
首先,Sundararajan输入一个零排列的数组,随后让输入数据逐步向需要测试的目标数据转变,以此通过输出变化来反过来研究内在逻辑。这里值得注意的是,随着每一步的变化,科学家们就能看到它确切的变化轨迹,从而可以以此预测变化特征。但这依然不可信,预测的结果仍然是存在很大误差的。
对此,美国华盛顿州微软研究所计算机科学家RiCh Caruana融入广义加法模型(GAM)来对数据间的复杂关系进行处理。我们都知道,统计学中GAM就是一种基于线性回归,然后在一组数据中找到线性趋势的方法。Caruana增加了这一过程,他先利用机器学习来输出变化,随后将网络输出的数据输入到GAM,找出变化之间的相关性,以此来研究神经网络的内在逻辑。
除此之外,在图像研究领域,还有科学家利用生成式对抗网络(GAN)对神经网络进行研究,然而所有的这些努力都是尝试,普适的研究方法至今尚未得出。
现在,不仅科学家认识到这一问题的紧迫性,多国政府也意识到这一问题。根据欧盟的一项指示,明年所有有巨大影响力的公司需向公众解释其模型的内在逻辑。此外,美国军方的蓝天研究机构国防高级研究计划署也正在向一个称为“可解释AI”的新计划投入7000万美元。
Google的机器学习研究员Maya Gupta说,硅谷的研究人员们也在试图打开AI的“黑匣子”。除了运行后操作的准确性,所有人心中还有一个非常大的顾忌:因为不知道它在做什么,所以不确定能不能相信它。
伴随着人工智能(AI)应用的蓬勃之势,出于安全隐患的考虑,神经网络内在逻辑的这一“盲点”确实急需规避。
AI研究的盲点:无解的神经网络内在逻辑相关推荐
- 2021-01-24过去十年十大AI研究热点,分别为深度神经网络、特征抽取、图像分类、目标检测、语义分割、表示学习、生成对抗网络、语义网络、协同过滤和机器翻译。
专利申请量全球第一!清华人工智能发展报告:国内215所高校成立相关本科专业 发布时间:01-2415:20万象大会年度获奖创作者,东方财富网官方帐号 1月20日,清华大学人工智能研究院.清华-中国工程 ...
- 摩根大通公布2021年AI研究博士生奖学金名单!获奖华人博士生占1/3
点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 本文转载自:AI科技评论 作者 | 陈彩娴 编辑 | 刘冰一 不久前,摩根大通(J.P.Morgan Cha ...
- 从事了两年 AI 研究,我学到了什么?
作者 | Tom Silver 译者 | 弯月 出品 | CSDN 我从事人工智能研究的工作已经有两年了,有朋友问我都学到了什么,所以我想借本文分享一些迄今为止积累的经验教训.我将在本文中分享一些常见 ...
- AI研究过于集中狭隘,我们是不是该反思了?
作者 | Sergii Shelpuk 译者 | 陆离 编辑 | 夕颜 出品 | AI科技大本营(ID: rgznai100) [导读]2019年是AI领域更加冷静的一年,少了些喧嚣和泡沫,大浪淘沙留 ...
- Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」
来源:机器之心 本文约4000字,建议阅读8分钟 本文为你介绍一种叫做分层 JEPA(联合嵌入预测架构)的架构. LeCun 认为,构造自主 AI 需要预测世界模型,而世界模型必须能够执行多模态预测, ...
- 图灵奖获得者Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」
来源:机器之心 LeCun 认为,构造自主 AI 需要预测世界模型,而世界模型必须能够执行多模态预测,对应的解决方案是一种叫做分层 JEPA(联合嵌入预测架构)的架构.该架构可以通过堆叠的方式进行更抽 ...
- 春节在家不再无聊,这份2019 AI研究进展回顾陪伴你
2020-01-28 13:24:06 2019 年可以说是「预训练模型」流行起来的一年.自 BERT 引发潮流以来,相关方法的研究不仅获得了 EMNLP 大会最佳论文等奖项,更是在 NLP.甚至图像 ...
- 腾讯医疗AI新突破:提出器官神经网络,全自动辅助头颈放疗规划 | 论文
来源:量子位 腾讯医疗AI实验室又有新研究. 这次跟美国加州大学合作,在国际权威期刊<Medical Physics>发表最新研究成果: <器官神经网络:深度学习用于快速和全自动整体 ...
- Google联手Facebook 要在AI研究上搞什么大事?
来源:网易智能 摘要:Google和Facebook宣布,使开源机器学习框架PyTorch与Tensor-Processing Units(TPU)进行合作.这种伙伴关系标志着人工智能研究合作进入新时 ...
最新文章
- 基于@AspectJ配置Spring AOP之一--转
- 如何把定义的数组传回主函数_java数组如何定义
- Android ViewModel详解
- linux应用程序后台操作
- SprinBoot易学难精
- linux服务器怎么防,Linux服务器防攻击的各种方案
- mysql重复你数据标识_MySQL 处理重复数据
- 微软发布TypeScript用以改进JavaScript开发
- 优秀的WBS的分解标准
- 希捷硬盘维修工具 v5.10.6 绿色免费版
- 免费的网站地图生成器,sitemap支持xml、html、txt生成绝对站长工具必备使用教程
- ftp服务器端口修改,如何修改服务器ftp端口教程
- 《增值电信业务经营许可证》如何办理?要什么材料?
- js页面中实现加载更多功能
- ECharts 区域缩放组件使用详解
- Oracle----Orcacle简介
- 实习篇四-----答辩(月末)
- (转)【翻译】火影忍者鸣人 疾风传 终级风暴2 制作介绍
- vue移动端适配—手动rem适配
- Excel VBA批量修改文件名
热门文章
- 递归计算从1到100之间的所有数之和。
- leetcode574. 当选者(SQL)
- 阿里Java编程规约(注释)提炼
- PRML(4)--Chapter2(下)-非参数估计
- java中的asList_Java中的Arrays.asList()方法
- 解决undefined reference to symbol ‘sem_close@@GLIBC_2.2.5‘问题
- 企业贡献开源,其背后的战略动机是什么?
- 手把手教你如何优化C语言程序
- 信息图:程序员/开发人员实际在用哪些工具
- 世上最伟大的十个公式,质能方程排名第五