论文阅读笔记:GraphRAD---A Graph-based Risky Account Detection System
GraphRAD: A Graph-based Risky Account Detection System
GraphRAD系统详解
1. 交易记录
将交易记录分为训练集和测试集。对于参数估计和调优,我们只使用出现在训练集中的账户标签,而在性能评价阶段使用测试集中的账户进行评价。在测试中,我们特别关注那些“遗漏的未被检测到的风险账户”。
2. 图生成器(Graph Generator)
在同一笔交易中,如果两个账户有相同的某种属性(如,收货地址),就在这两个用户中间构建一条边。
以此,将一段时期内的交易记录,构建成图,称 account link graph。
依照启发式方法,执行两步过滤操作:
- degrees filter:移除图中度非常大的节点
- 评价标签:
- Trusted labels 被分配给长期建立的账户,自建立以来没有任何关于它的欺诈报告
- Fraud labels 被分配给我们确信它就是欺诈账户的
- Risky labels 被分配给我们认为这个账户存在风险,但不确定它是不是欺诈账户
3. 种子模型(Seeding module)
Seeding module使用一组启发式规则为社区检测(Community Detection)模块挑选种子顶点(account)。种子顶点包括所有带欺诈标记的顶点和部分带风险标记的顶点。
4. 社区检测(Community Detection )
社区检测模块接收Seeding module提供的种子顶点,并在“account link graph”上执行局部图聚类算法,输出是一组子图(社区),每个子图都以种子顶点为中心。
local graph clustering
5. 筛选+合并(Screen + Merge)
利用社区统计训练的回归模型对社区风险进行排序,只保留风险较大的社区,称 big-comm,这样就进一步缩减了社区检测输出的子图规模,最后提交专家评审,又节约了大量时间和专家。
6.社区提取(Community Extractor)
该模块对欺诈者帐户进行集群,并为每个集群提取社区,它从“big-comm”中提取出几乎不重叠的小型欺诈社区。与后面将会介绍的评分模块中的帐户风险评分一起,这些小社区将呈现给人类专家。
hierarchical clustering + local graph clustering
7. 特征提取(Feature Extractor)
此模块使用交易记录中的属性为“big-comm”的每个顶点(帐户)生成特征向量。注意,这些属性不同于用于构建“big-graph”的属性,而是一组本文没有描述的交易风险指标。
8. 评分(Scoring)
评分模块接收从Feature Extractor中获得的特征向量,并执行半监督分类规则化的“big-comm”图。输出是分配给“big-comm”的每个顶点(帐户)的风险分数。
论文阅读笔记:GraphRAD---A Graph-based Risky Account Detection System相关推荐
- 虚假新闻检测的论文阅读笔记——sigir2021:User Preference-aware Fake News Detection
文章目录 1.虚假新闻检测的相关简介 2.本篇论文引言 3.模型介绍 3.1.内生偏好编码器 3.2.外生内容编码器 3.3.二者信息融合 4.实验 4.1.各模型的实验结果 4.2.消融实验 5.结 ...
- 论文阅读:A Novel Graph based Trajectory Predictor with Pseudo Oracle
A Novel Graph based Trajectory Predictor with Pseudo Oracle 摘要 1 引言 2 相关工作 3 PROPOSED METHOD IV. EXP ...
- 论文阅读笔记:Link Prediction Based on Graph Neural Networks
文章目录 说明 Abstract 1 Introduction 2 Preliminaries Notations Latent features and explicit features Grap ...
- 论文阅读笔记《Neural Graph Matching Network: Learning Lawler’s Quadratic Assignment Problem With Extension》
核心思想 该文提出一种图匹配神经网络用于解决Lawler's形式的二次分配问题,并将其推广到超图匹配和多图匹配领域.在之前的文章中,我们介绍过图匹配问题通常被定义为一种二次分配问题(QAP),通常 ...
- 论文阅读笔记:A Network-based End-to-End Trainable Task-oriented Dialogue System
提示:阅读论文时进行相关思想.结构.优缺点,内容进行提炼和记录,论文和相关引用会标明出处. 文章目录 前言 Abstract Introduction Model Intent Network Bel ...
- 【目标检测论文阅读笔记】Feature-Enhanced CenterNet for Small Object Detection in Remote Sensing Images
Abstract: 与 anchor-based基于锚点的检测器相比,anchor-free无锚点检测器 具有灵活性和较低计算复杂度的优点.然而,在复杂的遥感场景中,受限的几何尺寸.目标的弱特征 以及 ...
- 谣言检测相关论文阅读笔记:PAKDD2020-SAFE: Similarity-Aware Multi-Modal Fake News Detection
目录 Abstract 1.Introduction 2.Related Work 3.Methodology 3.1 Multi-modal Feature Extraction 3.2 Modal ...
- 论文阅读笔记《Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System》
面向即插即用任务的对话系统的多任务预训练 Abstract 预先训练的语言模型最近被证明有利于面向任务的对话(task-oriented dialogue,TOD)系统.尽管取得了成功,但现有方法通常 ...
- 自监督论文阅读笔记 Self-Supervised Pretraining for RGB-D Salient Object Detection
现有的基于 CNN 的 RGB-D 显著对象检测 (SOD) 网络都需要在 ImageNet 上进行预训练,以学习有助于提供良好初始化的层次特征.然而,大规模数据集的收集和注释既耗时又昂贵.在本文中, ...
最新文章
- Android 开发杂记
- 小学生python-小学生都能学会的python(函数)
- 【我所認知的BIOS】—gt;ADU.exe
- mybatis resultMap映射学习笔记
- jstack 脚本 自动日志_运维老司机又翻车, 居然没用过日志切割Logrotate
- tensorflow基础:tf.data.Dataset.from_tensor_slices() 与 tf.data.Dataset.from_generator()的异同
- 如何保证集合是线程安全的? ConcurrentHashMap如何实现高效地线程安全?(转)
- 定时监控服务,告警,并启动服务
- sama5做linux的sd卡启动u盘,windows中service.msc与regedit
- 最新迅雷“应版权方要求,文件无法下载”的解决办法
- idea 离线安装 idea json view 插件
- 黑域 绿色守护 安卓最好的省电工具?
- 分享盘点9个可免费使用的网站CDN加速服务
- Septentrio板卡接收机连接方式
- 实力秒杀ArcGIS,各种地图数据一键快速制图
- MATLAB 中的randn函数
- 树莓派基础实验20:火焰报警传感器实验
- 时间在线验证 java代码_timetest.java 源代码在线查看 - Java获取各种常用时间方法 资源下载 虫虫电子下载站...
- 前后端分离时ajax发送请求时后端能接送,但是前端的response为空时
- 蓝奏云网盘在线上传源码