背景

「图」 (Graph) 普遍用于建模结构/关系性数据,「节点」 (vertices/nodes) 表示实体,「边」 (edges) 表示实体间存在的关系。

「异常检测」(Anomaly detection)指从数据中挖掘出与大部分对象不同的目标对象(异常点/离群点),这些目标对象的分布和产生机制与其它对象不同。

「图异常检测」(Graph anomaly detection)问题是指:

  • 「Object-level」:在单个图中识别出异常的图对象,例如异常节点、异常边或者异常子图(node/edge/sug-graph-level anomalies);

  • 「Graph-level」:在图集合/图序列中识别出异常图;

传统异常检测方法和图异常检测方法的区别如下图所示,传统方法不能高效地用于大规模图学习任务并且难以捕获对象节点间的关系,因此基于深度学习的图异常检测方法逐渐兴起,尤其是图神经网络 GNN 的热潮。

但基于深度学习的图异常检测方法存在非常多的局限性:

  • 如何设计异常感知的模型目标函数,可以在模型训练过程中区分异常对象?

  • 如何解释模型检测到的异常,尤其在于金融等传统行业?

  • 如何提高模型的的训练效率并且节约计算资源?

  • 如何在缺少监督信息的情况下优化深度模型的超参数?

面向图数据的异常检测可以应用于社会生活的各个领域,如金融、互联网安全、社交关系挖掘、电信诈骗检测等等。

本文主要学习和总结下当前基于深度学习的图异常检测算法,主要依赖的论文大纲 [^1] 并对其进行简化和补充。

算法模型

根据算法模型的检测级别图异常检测任务大体上分为三类:

  • Node-Level:图异常检测丨异常节点检测算法模型概述

  • Edge-Level:图异常检测丨异常边检测算法概述

  • (Sub)Graph-Level:图异常检测丨异常(子)图检测算法概述

在上述分类下可以根据图数据类型可以进一步区分,主要包括:① 静态图:简单图,属性图 ② 动态图。

基于机器学习和深度学习的图数据异常检测综述相关推荐

  1. 基于深度学习的日志数据异常检测

    基于深度学习的日志数据异常检测 数据对象 智能运维(AIOps)是通过机器学习等算法分析来自于多种运维工具和设备的大规模数据.智能运维的分析数据对象多源运维数据包括系统运行时数据和历史记录数据,历史记 ...

  2. Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习、深度学习、大数据、云计算等)推荐系统(包括语音生成、识别等前沿黑科技)

    Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习.深度学习.大数据.云计算等)推荐系统(包括语音生成.识别等前沿黑科技) 导读 基于Python的GUI界面设计的一套 ...

  3. 基于机器学习与深度学习的金融风控贷款违约预测

    基于机器学习与深度学习的金融风控贷款违约预测 目录 一.赛题分析 1. 任务分析 2. 数据属性 3. 评价指标 4. 问题归类 5. 整体思路 二.数据可视化分析 1. 总体数据分析 2. 数值型数 ...

  4. 资源 | AI、神经网络、机器学习、深度学习以及大数据学习备忘单

    向AI转型的程序员都关注了这个号☝☝☝ 以下是关于神经网络.机器学习.深度学习以及大数据学习的备忘单,其中部分内容和此前发布的<资源 | 值得收藏的 27 个机器学习的小抄>有所重复,大家 ...

  5. 【网络流量识别】【深度学习】【三】CNN和LSTM—基于信息获取和深度学习的网络流量异常检测

    本文是北京大学陆祥林等人,2019年四月发表于ICISDM的一篇文章,收录于ACM网站. 文章题目:基于信息获取和深度学习的网络流量异常检测 原文网址:基于信息获取和深度学习的网络流量异常检测|201 ...

  6. SCI总结基于计算机视觉和深度学习的精准农业杂草检测模型

    一.介绍 本研究提出了一种新的基于计算机视觉和深度学习的精准农业杂草检测和分类(CVDL-WDC)模型.所提出的CVDL-WDC技术旨在正确地区分植物和杂草.所提出的CVDL-WDC技术包括两个过程, ...

  7. 什么是机器学习、深度学习、图神经网络?

    人工智能是追求目标,机器学习是实现手段,深度学习是其中一种方法. 1 机器学习 机器学习是一类算法的总称,这些算法企图从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以 ...

  8. 【机器学习基础】机器学习和深度学习的练习数据

    0.导语 初学者学习机器学习和深度学习的时候,经常会找不到练习的数据,本文提供了获取数据的一些方法. 一.scikit-learn自带数据集 Scikit-learn内置了很多可以用于机器学习的数据, ...

  9. 【机器学习基础】获取机器学习和深度学习的练习数据

    0.导语 初学者学习机器学习和深度学习的时候,经常会找不到练习的数据,本文提供了获取数据的一些方法. 一.scikit-learn自带数据集 Scikit-learn内置了很多可以用于机器学习的数据, ...

  10. 大数据 深度 分页_机器学习、深度学习、大数据 ?傻傻分不清楚?

    提起机器学习四个字,不知你的脑海中是否会有一丝印象?毕竟身处信息时代,在日常生活中,无论通过什么媒介,接触到这个名词概念的机会还是挺大的.与之类似,还有以下这些名词概念:数据分析.数据挖 掘.深度学习 ...

最新文章

  1. 计算机培训校本研修心得,精选校本培训心得体会三篇
  2. zabbix_监控_进程
  3. 不是python对文件的读操作方法的是-python的文件操作方法
  4. 为什么在EOS上的DApp对开发人员来说不盈利?
  5. 树莓派AI视觉云台——8、WiringPi库函数
  6. 开关稳压电源过热(高温)保护功能作用--来自中港扬盛分享干货
  7. 业务太复杂?教你如何降低软件的复杂性
  8. [编程入门]宏定义的练习:输入两个整数,求他们相除的余数。用带参的宏来实现,编程序。
  9. 垂直梯形校正画质损失多少_投影小常识 梯形矫正竟会影响清晰度
  10. C++:fseek( FILE *stream, long offset, int origin )
  11. 【Flink】Flink自定义UDF以及为函数启用别名
  12. linux 权限加号是,请教:drwxrwxr-x   什么权限后面有个加号,代表什么意思
  13. 使用Pls_Integer的好处
  14. c++笔试题整理(二)
  15. python中map()函数的用法讲解
  16. HOJ 2739 The Chinese Postman Problem
  17. java蓝字代表什么_蓝是什么意思 蓝字五行属什么
  18. 30岁哥大计算机博士生遇刺身亡,论文刚被顶会接收,曾留学中国
  19. 关于微信聊天与朋友圈如何快速切换 Mark
  20. 强迫症去掉‘Backend QtAgg is interactive backend. Turning interactive mode on.’提示

热门文章

  1. 【最优化】序列(逐步)二次规划法(SQP)
  2. 依图科技CTO颜水成被曝离职!或加入东南亚某电商
  3. Python-illegal multibyte sequence
  4. 【EasyExcel】 模板填充批量导出,多文件以zip压缩包格式导出
  5. convert bitset descriptor - cv::Mat
  6. 淘宝/天猫获取商品历史价格信息 API 返回值说明
  7. 一文搞懂this指向
  8. mysql触发器安全吗_猎八哥浅谈MYSQL触发器
  9. 计算机服务中无spool,print spool自动关闭,print spooler
  10. Ubuntu 16.04下安装Preempt_rt