核心思想

  本文提出一种基于自相似度的异常检测方法,核心思想在于正常样本图像之间的相似性更大,而缺陷样本和正常样本之间的相似性更小,如果某个样本与正常样本之间的最小距离都超过一个阈值时,就判定为异常样本。首先利用一个在ImageNet数据集上预训练好的特征提取网络对正常样本进行特征提取,然后对特征向量进行PCA降维,降维后再进行K-means聚类,每个类别中距离聚类中心最近的样本就作为这个类别的代表,所有类别代表构成一个正常样本字典。然后测试时用测试样本分别计算与字典中所有类别代表之间的欧氏距离,并计算其中距离最小的m个距离的平均值,如果这个平均值大于阈值就认为该样本属于缺陷样本,距离值的大小也就表示了它“不正常的程度”。
  首先,对图像样本按照固定尺寸和步长进行分割,得到大小相同的图块。这种情况下许多像素点可能同时属于多个图块,对于每个像素点的“不正常程度”可以通过计算他所属的多个图块的“不正常的程度”的平均值得到。

  然后,使用一个在ImageNet数据集上预训练得到的ResNet-18网络作为特征提取网络,用于特征提取,每个图块PtP_tPt​输出NNN个特征向量ftf_tft​。经过主成分分析PCA降低维度到MMM个特征向量,并对这M个特征向量进行规范化处理

  将整个数据集的特征向量进行K-means聚类,得到kkk个类别和对应的类别中心,每个类别选择与类别中心距离最近的那个样本的特征向量作为类别代表,添加到正常样本字典中,因此字典中包含kkk个类别样本对应的特征向量。整个字典构建过程如下图所示

  接下来是阈值的设定,与先前将阈值作为一个超参数进行人为设定的方式不同,本文利用验证集(均是正常样本,但与训练集不重叠)来计算阈值。对验证集图像进行相同的处理:图块分割,特征提取,规范化。然后计算其与字典中各个类别特征向量之间的欧氏距离,并选择其中距离最近的mmm个样本,计算平均距离ddd。最后计算整个验证集VTV_TVT​距离ddd的均值μd\mu _dμd​和方差σd\sigma _dσd​,并按照以下方式计算阈值ththth

其中α\alphaα作为一个调整参数,用于调节阈值的边界范围,α\alphaα越小,表示该系统更倾向于提高召回率。测试时,计算测试样本与字典中正常样本之间的欧式距离,同样取最近的mmm个样本计算平均值dtestd_{test}dtest​表示该图块的“不正常程度”,当该值大于阈值时即判定为异常样本。

实现过程

网络结构

  采用ResNet-18网络,只需要利用特征提取部分,输出conv5_x或average_pool的结果作为特征向量。

创新点

  • 提出一种基于自相似度的异常检测算法,通过构建正常样本字典,然后比对测试样本与正常样本之间的距离,来计算测试样本的不正常程度
  • 通过计算验证集与字典中样本之间的距离分布来设定阈值

算法评价

  本文的方法还是一种基于正向样本的检测方法,但这里不存在一个训练的过程,其实只是利用卷积神经网络作为一个特征描述器,而且正向样本其实并不存在明确的类别关系,而只是依靠特征向量的相似程度进行聚类,最后通过比对样本特征向量之间的欧氏距离来判断该样本是否属于异常样本。该方法本质上应该是属于传统方法的范畴,在特征提取网络可靠的前提下,我觉的该方法还是有一定的实际价值的,但还有一个重要的问题就是这个方法的计算速度实在是比较慢,一张图片要处理数十秒中,在一些实时性要求高的领域中就无法应用了,感觉优化解决这个问题也是一个不错的点。

如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。

论文阅读笔记《Anomaly Detection in Nanofibrous Materials by CNN-Based Self-Similarity》相关推荐

  1. 《Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs》论文阅读笔记

    <Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs>论文阅读笔记 主要挑战贡献: KG上的推理挑战主要 ...

  2. 论文阅读 | NIPS‘20 | Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs

    很有意思的一篇paper.在众多Knowledge Graph Embedding (KGE) 的论文中通过问题设计和有意思的解决方式脱颖而出. 首先来看看问题设计. 一般的KGE model都是利用 ...

  3. Beta Distribution Guided Aspect-aware Graph for Aspect Category Sentiment Analysis论文阅读笔记(EMNLP2021)

    目录 标题翻译:基于Beta分布引导方面感知图的方面类别情感分析 原文链接:https://aclanthology.org/2021.emnlp-main.19.pdf 摘要: 1 引言 2 相关工 ...

  4. Phrase-BERT: Improved Phrase Embeddings from BERT with an Application to Corpus Exploration论文阅读笔记

    问题: 因为bert是在长文本(512token长度)预训练的,因此,如果没有特定于任务的微调,BERT在短语和句子上的表现通常比简单基线(如GLoVe的平均池化)更差.且字节2020在EMNLP上的 ...

  5. DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记

    DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记 Article Background ...

  6. [论文阅读笔记] Are Meta-Paths Necessary, Revisiting Heterogeneous Graph Embeddings

    [论文阅读笔记] Are Meta-Paths Necessary? Revisiting Heterogeneous Graph Embeddings 购物返利 www.cpa5.cn 本文结构 解 ...

  7. 论文阅读笔记—Reasoning on Knowledge Graphs with Debate Dynamics(AAAI,2020)

    这是一篇非常有趣的工作,看完会觉得眼前一亮. 论文标题:Reasoning on Knowledge Graphs with Debate Dynamics 发表于AAAI,2020 动机  很多机器 ...

  8. 论文阅读笔记——《a simple but tough-to-beat baseline for sentence embeddings》

    <a simple but tough-to-beat baseline for sentence embeddings>published at ICLR 2017. ICLR会议的论文 ...

  9. Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction论文阅读笔记

    我的博客链接 0. 前言 1. 作者试图解决什么问题? 作者想在KGE中对语义层级(semantic hierarchies)进行建模. 2. 这篇论文的关键元素是什么? semantic hiera ...

  10. 斯坦福图机器学习CS224W笔记自用: Reasoning in Knowledge Graphs using Embeddings

    1. 基于嵌入的知识图推理 目标:如何对知识图进行多跳推理? 知识图推理: 回答多跳查询 路径查询 连接查询 Query2box 示例:生物医学图 知识图谱上的预测查询 我们是否可以进行多跳推理,即在 ...

最新文章

  1. python命令行参数处理
  2. 同浩软件正式投放户外广告
  3. javascript的函数定义的区别
  4. VS2013默认打开html文件没有设计、拆分、源视图的解决办法
  5. 解决Visual Studio “无法导入以下密钥文件”的错误
  6. 交公粮了:国庆在家我都逛哪些技术网站?
  7. WebAPI前置知识:HTTP与RestfulAPI
  8. git恢复删除前的版本
  9. 中国十大穷光蛋排行榜
  10. 2014 android 应用开发大赛,2014年全国高校移动互联网应用开发创新大赛
  11. 正在使用的项目,项目名那里出现了红色感叹号?怎么去除?
  12. FLASH BUILDER 清除图片缓存
  13. 联想拯救者Y9000P安装ubuntu22.04和安装anaconda教程
  14. 微信小程序:事件传参
  15. python图片剪裁(图片按四个点坐标剪裁)
  16. boxplot 箱线图剔除离群值
  17. 大觉寺,鹫峰,农家院 游玩
  18. 圣路易斯大学计算机科学,圣路易斯华盛顿大学计算机科学硕士排名第50(2020年TFE Times排名)...
  19. 基于RNN的英文姓名的性别预测
  20. 在来电监听服务中动态注册去电广播(BroadcastRecevier)

热门文章

  1. 数字水印(DWT算法Python实现)
  2. 接入支付宝出现交易订单处理失败,请稍后再试(ALI64)的错误
  3. 【sigma 协议】
  4. scrapy 远程登录控制台
  5. 专心致志求精进——给自己的生日祝福
  6. 【转载】KaTeX 数学公式大全
  7. AI探索太阳系:从检测月球巨石,到挑战火星“恐怖七分钟”
  8. 栈和队列的区别,栈和堆得区别
  9. 详细解读目标检测经典算法-SSD
  10. CloudSim Plus任务调度策略对比