Concept Whitening for interpretable image recognition用于可解释图像识别的概念白化

Zhi Chen, Yijie Bei, Cynthia Rudin(Nature Machine Intelligence, Vol 2, Dec 2020, 772-782)

Deep neural networks achieve state-of-the-art performance in image recognition. But what does a neural network encode in its latent space?
深度神经网络在图像识别中实现了最先进的性能。但是,神经网络在隐空间中编码了什么呢?
Ideally, we want the latent space to be disentangled,meaning that different parts of the latent space represent different concepts that are understandable to humans.
理想情况下,我们希望隐空间是解开的,这意味着潜在空间的不同部分代表了人类可以理解的不同概念。
With axes aligned with predefined concepts,we will see how an image travels through the layers of the neural network.
使用轴与预定义的概念对齐后,我们将看到图像如何穿过神经网络的各个层。

For example, let’s consider the latent space of the Batch Norm layer, in which the outputs are already standardized.
例如,让我们考虑Batch Norm层的隐空间,其中的输出已经标准化。
Points sharing the same color are samples of the same concept .
共享相同颜色的点是相同概念的样本。
Let’s create a vector pointing towards each concept.
让我们创建一个指向每个概念的向量。
These vectors may point towards similar directions or have different lengths, making them impossible to be aligned on the axes.
这些矢量可能指向相似的方向或具有不同的长度,使得它们不可能在轴上对齐。
If the concepts aren’t aligned on the axes, then the information is not disentangled.
如果概念没有在轴上对齐,那么信息就不会解开。
Remember, each axis represents a neuron. So if the concepts are aligned on the axes, only that neuron represents the concept. All the information about the concept only flows through that neuron.
记住,每个轴代表一个神经元。因此,如果概念在轴线上对齐,那么只有那个神经元代表这个概念,所有关于这个概念的信息都只流经那个神经元。

We introduce a new module called Concept Whitening(CW) that can solve this problem.
我们引入了一个新的模块,称为概念白化(CW),它可以解决这个问题。
When a CW module is added to a CNN, the latent space is whitened (decorrelated and normalized) and the axes of the latent space are aligned with concepts of interest.When CW is added to different layers, different aspects of the target concept can be learned.
当CW模块被添加到CNN时,隐空间被白化(去相关和归一化),潜在空间的轴线与感兴趣的概念对齐;当CW被添加到不同的层时,目标概念的不同方面可以被学习。

In earlier layers, color and texture information related to the concepts are represented along the axes.For example ,the “airplane” concept is characterized by white or gray objects on a blue background,the “bed” concept is characterized by warm colors, the “person” concept is characterized by dense textures.
在较早的层次中,与概念相关的颜色和纹理信息是沿着轴线表示的,例如,“飞机”概念的特征是蓝色背景上的白色或灰色物体,“床”概念的特征是暖色,“人”概念的特征是密集的纹理。

In deeper layers, pure high-level semantic meaning of target concept is captured by the axes.
在更深的层次上,目标概念的纯高层语义被轴线捕获。
The target concepts are not restricted to objects. CW can also handle general concepts such as weather or material.
目标概念并不局限于对象。CW还可以处理天气或材料等一般概念。

With axes aligned with predefined concepts, we will see how an image travels through the layers of the neural network. This example above demonstrates the network is considering different concepts for its decision-making process over the course of its layers.
轴与预定义的概念对齐后,我们将看到图像如何穿过神经网络的各个层。上面的例子表明,网络在其各层的决策过程中正在考虑不同的概念。

Concept Whitening for interpretable image recognition 用于可解释图像识别的概念白化相关推荐

  1. Concept Whitening(for Interpretable Image Recognition)

    和BatchNorm相比有很多优点,并且可以直接替换BatchNorm. 有更好的interpretability(可解释性),可以可视化得解释神经网络层的含义.(这是最突出的特点)concepts ...

  2. 【时序】N-BEATS:用于可解释时间序列预测的神经基础扩展分析

    论文名称:N-BEATS: Neural basis expansion analysis for interpretable time series forecasting 论文下载:https:/ ...

  3. KDD 2018 | 小波分解网络用于可解释的时间序列分析

    关注微信公众号"时序人"获取更好的阅读体验 时间序列学术前沿 NeurIPS 2020 | 时间序列相关论文一览 ICML 2020 | 时间序列相关论文一览 KDD 2020 | ...

  4. python 分类变量xgboost_用于可解释机器学习的四个Python库

    我们知道,人工智能也可能存在偏差,随着大家对这一点的关注度越来越高,企业越来越需要能够对其模型产生的预测进行解释,了解模型本身是如何工作的.好的一点是,有越来越多的Python库正在开发中,试图解决这 ...

  5. 【CV】NASNet:基于神经架构搜索得到的用于可扩展图像识别的 CNN 可迁移架构

    论文名称:Learning Transferable Architectures for Scalable Image Recognition 论文下载:https://arxiv.org/abs/1 ...

  6. 如何二值图转化为灰度图_AAAI 2020 | 时序转化为图用于可解释可推理异常检测

    本文首发于微信公众号:时序人,关注获取更佳阅读体验 作者 | 文杰 时间序列表示学习旨在学习一个将原始时间序列自动转换为向量表示的函数,是时间序列领域研究的基本问题.近年来,将时序进行分段并学习特征表 ...

  7. 用于可解释机器学习的 Python 库

    由于对人工智能偏见的担心日益凸显,从业者解释模型产出的预测结果的能力以及解释模型自身运作机制的能力变的越来越重要.幸运的是,已经有许多python工具集被开发出来,用以解决上述问题.下文我将对现有4个 ...

  8. 数据预处理之白化(Whitening transformation)

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接: https://blog.csdn.net/hjimce/article/deta ...

  9. Nature Machine Intelligence论文:「概念白化」,提供神经网络可解释性的新技术

    ‍‍‍‍‍‍‍‍‍‍‍作者:Ben Dickson(软件工程师.TechTalks 的创始人) 译者:hhhnoone 原文:Deep learning doesn't need to be a bl ...

最新文章

  1. sublime Text3快捷键使用大全
  2. 关于软件质量(2)- 开发 vs 测试
  3. oracle today函数,oracle日期函数集锦
  4. 大型运输行业实战_day12_1_权限管理实现
  5. 对std::listT的封装
  6. Win7如何关闭 打开文件-安全警告
  7. 终于有人把 5G 和边缘计算的关系说清楚了! | 技术头条
  8. day12 python学习随笔 中
  9. 【i.MX6ULL】驱动开发12——电容触摸驱动实践(上)
  10. vue实时显示当前时间
  11. 神经网络模型结果怎么看,神经网络模型怎么预测
  12. mysql execute stmt_mysql_stmt_execute()
  13. tungsten-replication实现mysql-mongo数据同步
  14. 如何扩展关键词,以及使用python多线程爬取bing搜索结果
  15. Gartner曾劭清:云计算市场依然存在太多变局
  16. Windows-dos命令
  17. e1000网卡驱动第二天
  18. HTML5 视频 Video
  19. npm internal/modules/cjs/loader.js:883 throw err; ^ Error: Cannot find module ‘code-point-at‘ Requir
  20. Single Image Haze RemovalUsing Dark Channel Prior

热门文章

  1. Testpoint设置的疑问
  2. python使用大数据分析师_Python+大数据分析师
  3. 基于SSM+Vue的电影售票系统Java电影院票务管理系统电影订票系统(源码调试+讲解+文档)
  4. SAR-Scape处理SBAS-InSAR报错原因之一
  5. 使用J-Link启动海思3516最小系统
  6. 最新JAVA调用新浪微博API之发微博(转)
  7. C++ Socket网络编程1.6版本 添加高精度计时器测量处理能力
  8. Java中千变万化字符串
  9. 导入keras训练好的模型报错解决OSError: Unable to open file (unable to open file: name = ‘model_3.h5’)
  10. mac层到ath9k层,ath9k层到硬件层