【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击
目录
1、简介
2、图机器学习应对金融欺诈对抗攻击
背景
图机器学习识别金融欺诈
挑战
挑战1-类别不平衡的解决
挑战2-标签不可信的解决
挑战3-分布有漂移的解决
图机器学习应对欺诈对抗攻击
从数据角度出发
从攻击者角度出发 (倾向于添加异构边)
总结展望
问答
3、参考
1、简介
报告主题
图机器学习应对金融欺诈对抗攻击
报告嘉宾
敖翔(中国科学院计算技术研究所)
报告摘要
近年来,图机器学习方法由于其强大的关联特征提取能力,在数字金融反欺诈应用中取得了显著成效。然而,该场景中的动态对抗成为了制约图机器学习方法取得进一步提升的重要挑战之一。如何净化图结构中已存在的对抗攻击,如何增强图机器学习的鲁棒性提升分布外样本的泛化能力,成为近期研究热点。本报告将围绕图的同异质性偏好假设、对抗攻防、可解释性等技术,介绍图机器学习方法在应对动态对抗、增强分布外泛化能力和可解释性方面的研究进展,并探讨此方向值得关注的技术趋势。
报告人简介
敖翔,博士,中国科学院计算技术研究所副研究员,硕士生导师,CCF高级会员。研究方向为智能金融、数据挖掘与自然语言处理。先后主持国家自然科学基金项目3项,CCF-腾讯犀牛鸟科研基金(获优秀奖)、腾讯广告犀牛鸟专项基金、阿里巴巴AIR计划(获优秀学术合作项目)、蚂蚁金服金融安全专项基金等10余项科研项目,在IEEE TKDE、KDD、WWW、ICDE、SIGIR、ACL、AAAI、IJCAI等国际权威期刊和会议上发表论文60余篇,其中CCF A类30余篇。入选北京市科技新星、中科院青促会、微软亚洲研究院“铸星计划”。担任SIGKDD、WWW、ACL、AAAI、IJCAI等学术会议的高级程序委员或程序委员。
2、图机器学习应对金融欺诈对抗攻击
背景
图机器学习识别金融欺诈
获取数据集
数据很多,标签也易获得(监督学习)
用户注册时+用户活动+用户关系收集
拿到数据后就可以训练模型,如下
为啥使用图机器学习?
挑战
存在三个挑战
挑战1-类别不平衡的解决
类别不平衡:坏人还是少的
默认整个数据集都有label
重采样
先对正常和非正常的节点采样差不多的量;之后距离自适应采样
少数类别做过采样+降采样;多数类别值做降采样
框架
其实就是在GNN聚合之前做了采样(集合的扰动)
实验结果
baseline
真实数据集上提升会多些
实验分析可以采纳
挑战2-标签不可信的解决
所谓的好人可能不是好人,有可能检测错误-误判(也就是白样本能不能用,用多少的问题)
可以采样小规模白样本套模型做(未做报告)
挑战3-分布有漂移的解决
时序图,在图变化过程中,图的分布发生了改变
引出下文做的欺诈对抗攻击
图机器学习应对欺诈对抗攻击
从数据角度出发
识别攻击恢复图结构
从数据的角度解决,识别噪声则消除该噪声
以往方法
对比学习
在采样上改进
核心关键
图净化
实验
从攻击者角度出发 (倾向于添加异构边)
攻击者提升了自身的异质偏好的概率
大部分情况下是正常节点,少数异常节点
降低偏差,提升异质节点偏好的性能
在模型训练上改进(设置不同seed等)
直接置0(相当于做了mask)
实验结果
总结展望
数据缺失
落地上
其中在可解释性上有初步研究成果
指定边关系传播(使用元图指导消息传递)
定义搜索空间,然后将NAS引入
发现特征传播就足够
问答
1、异质偏好含义:
一条路径上两端节点label是相反的
2、构造的图稀疏
是的,现实生活中的图也是稀疏的(大规模稀疏图暂时也没什么好的方法,依旧处于探索中)
3、参考
LOGS 第2022/09/04期 ||中科院计算所敖翔:图机器学习应对金融欺诈对抗攻击
LOGS第20220904期 中科院计算所敖翔:图机器学习应对金融欺诈对抗攻击_哔哩哔哩_bilibili
Ao, Xiang-ICT, CAS-Homepage
【GNN报告】ICT敖翔:图机器学习应对金融欺诈对抗攻击相关推荐
- 机器学习(13)——对抗攻击
文章目录 前言 1 原理 2 攻击方式 2.1 针对模型的攻击 2.1.1 白盒攻击 2.1.2 黑盒攻击 2.2 针对输出的攻击 2.2.1 无目标攻击 2.2.2 有目标攻击 3 对抗样本生成方式 ...
- 【李宏毅机器学习】adversarial attack 对抗攻击
note: 对抗训练(adversarial training)通过对抗攻击(adversarial attack)的手段,即生成对抗样本(对部分原样本加入微小的扰动,可能导致误分类),是的NN能适应 ...
- 【GNN报告】赵越-图神经网络与异常检测
目录 1.简介 2.图神经网络与异常检测 小引 图异常检测 背景 系统PyGOD 基准BOND综述 未来方向 总结 小结 QA 3.参考 1.简介 摘要: 在这次演讲中,赵越会围绕异常检测与图上的异常 ...
- 全面回顾2020年图机器学习进展,12位大神论道、寄望2021年大爆发
2021-01-10 18:22:01 作者 |Michael Bronstein 编译 | Mr.Bear 编辑 | 陈大鑫 图机器学习在 2020 年大放异彩,各种新理论和新应用精彩纷呈. 就在近 ...
- 李宗纯:图机器学习在度小满风控中的应用
来源:DataFunTalk 本文约6900字,建议阅读10+分钟 本文主要介绍度小满的超大规模图平台,以及它在真实金融风控业务中的应用.其中会包括一些应用方法和案例,希望能为大家在图机器学习落地产品 ...
- AAAI 2020 开源论文 | 一种针对图嵌入模型的受限黑盒对抗攻击框架
AAAI(人工智能促进协会年会)是人工智能领域的顶级国际会议之一.今年的 AAAI 2020 是第 34 届,于 2 月 7 日至 12 日在美国纽约举行.今年,第 3 次参会的腾讯 AI Lab 共 ...
- 【GNN报告】GNN可解释性 基于几何与拓扑特性的图学习
目录 1.中国科学技术大学 王翔: GNN可解释性 简介 GNN可解释性背景 后事可解释性 2022 TPAMI Reinforced Causal Explainer for Graph Neura ...
- 【GNN报告】潘世瑞: 图自监督新范式-重新思考图对比学习
目录 1.简介 2.重新思考图对比学习 大纲 GRL背景 GRL现有问题/挑战 GCL现有问题/挑战 重新思考GCL 组判别-一个新范式 实验结果 小结 讨论 3.参考 1.简介 报告主题 重新思考图 ...
- CS224W图机器学习笔记自用:GNN Augmentation and Training
Recap: today's outline: (4)Graph augmentation (5)Learning objective 1. GNN 的图增强(Graph Augmentation f ...
最新文章
- java:volatile,instanceof,strictfp关键字
- 支付宝回应“崩了”:机房网络出现短暂抖动,已恢复正常
- POJ 1007 DNA Sorting
- 求一个正整数是哪几个正整数相加的和,这些数不能相同
- 再度吐槽,PHP在centos7的安装方式稍不注意可能就打击你的积极性
- oracle sql loop merge,Oracle之存储过程和MERGE INTO语句
- 第六章 实验报告(函数与宏定义)
- 利用SAN做数字化世界的基石
- primefaces教程_Primefaces BlockUI组件示例教程
- 解决问题 WebDriverException: Message: unknown error: cannot find Chrome binary
- pycharm python3.5 神奇的导入问题
- 如果出现这些,你就必须跳槽了
- 10.6 全源(All pairs)负权Johnson算法
- 经纬度及其与坐标系的转换
- 成倍提升ORM系统SQL性能的一个方法
- 【量子机器学习】HHL算法: Quantum algorithm for solving linear systems of equations
- unity检测范围内敌人_怎样获取离自己距离最近的敌人
- 无源贴片晶振四角引脚_有源晶振引脚图,有源晶振引脚定义
- 每日一思(2022.5.19)——前无古人后无来者
- 如何制作视频抠图?制作视频抠像的教程分享给你