1. 这个研究旨在确定那些故意申请破产来避免交税的公司。介绍了一个新的方法关于如何从一个时间加权网络中定义并提取出特征,如何利用整合在欺诈检测中基于网络的本质的特征。
  2. 欺诈检测是一个包括很多种类不同的申请者和不同要求的研究领域,包括信用卡欺诈,通话记录欺诈,洗钱,保险欺诈和通讯欺诈。这些问题通常表现出相同的特征,但每个问题的具体解决办法是特定领域的。数据挖掘技术,在大量数据中寻找特征和异常,已经证明在危险评估中是有用的,但是欺诈是一个非典型的例子需要领域知识。
  3. 这里认为欺诈是时间相关的现象,这个方法被设计成一个主题的特征和欺诈的可能性会随着时间改变。
  4. 继承了欺诈的公司的许多资源的公司在未来表现出更高的欺诈危险性,
  5. 网络传播算法,通过网络传播小数量的欺诈行为然后推断网络中的每个节点的欺诈风险评分,就像上图中的那样展示了欺诈如何在网络中传播,像病毒一样。节点距离一个欺诈源越近,有更高的可能性重复这种欺诈行为,这叫做propagation effect.
  6. 欺诈检测是确认高危欺诈实例的自动的过程,参考任何一个可以估计一个欺诈模型的技术,例如树模型,线性或逻辑函数,svm,ann,beyesian learning,ensemble models等等。
  7. 论文中的GOTCHA!方法的framework。
  8. GOTCHA!s Fraud Detection Framework
  9. 图5更详细地说明了我们在社会安全上下文中提出的欺诈检测阶段的框架(参见图4)。我们从三个数据源开始,一个事实数据源包含特定于公司的信息,例如每个公司的区域、部门和法律特征。历史数据日志记录公司信息的变更,例如,当公司变更其合法席位时。事务性数据是创建全局网络结构的基础,该结构以二分图的形式表示公司和资源之间的关系。由于企业与资源之间的历史关系包含着重要的信息,我们使用历史数据源重建历史链接并将其添加到网络中,根据链接的近况对其进行加权。网络中大约有350K个活跃和非活跃的公司和500万资源。

    According to Verbeke (2012) 变量可以分为两类。

    Definition 1:局部变量或内在变量: 表示公司的内部信息,就好像它是单独处理的一样.这些变量包括区域、部门、历史和法律特征。

    Definition2: 网络变量:聚合由每个公司的邻居所包含的信息。我们假设一个公司的邻居的行为对公司本身有影响。根据直接邻域还是考虑全网络的情况,可分为直接网络变量和间接网络变量。

  10. Network Analytics for Fraud Detection

    General Concepts and Notations

    相比于非二分图,二分图包含两种节点。二分图中的每个边都连接不同类型的节点。对应邻接矩阵n*m,n和m分别是两种节点的数量。

    Time-weighted Bipartite Networks

    现实往往难以用数学公式甚至图形来表示。通过选择最相关的数据特征进行分析,将专家知识的丰富性与网络分析的技术局限性联系起来尤为重要。欺诈检测的目标是发现高风险公司,但资源是一个重要的指标,因为它们有助于执行公司的(欺诈)活动。资源从一个公司转移到另一个公司。如果一个当前合法的公司从一个欺诈的公司继承资源,这将大大增加该公司的欺诈风险。因此,我们创建了一个二分图,将公司与其过去和现在的资源连接起来。采用无向网络,因为欺诈可以从一个公司传递到一个资源,反之亦然。

    为了容易计算,图的表示映射成一个权重矩阵W,size是c*r,c和r分别指定公司和资源的数量。公司与资源之间的关系强度在时间上呈指数加权:

  11. h= 0代表当前的联系。衰减常数的值表示过去的信息衰减的速度,仅仅考虑有限的过去信息。例如如果专家说这些关系在x天后是无关紧要的,那么我们选择在时间值大于x的时候γ让衰减函数变成0。

  12. 例如,如果一个决定的信息只有5年前应该考虑,然后γ≈1。矩阵W与时间有关。将欺诈的时间演变特征纳入考虑,

  13. 表示时刻t的相关结构。

    社会保障二分图大约包含350k个活跃和不活跃的公司,在每次分析的时间戳中有500万活动和非活动资源。在每一个时间戳,网络密度大约是4.5×10−6。

Network-based Fraud Detection for Social Security Fraud相关推荐

  1. Kaggle系列-IEEE-CIS Fraud Detection第一名复现

    赛题背景 想象一下,站在杂货店的收银台,身后排着长队,收银员没有那么安静地宣布您的信用卡被拒绝了.在这一刻,你可能没有想到决定你命运的数据科学. 非常尴尬有木有?当然你肯定有足够的资金为50个最亲密的 ...

  2. Alleviating the Inconsistency Problem of Applying Graph Neural Network to Fraud Detection阅读笔记

    Alleviating the Inconsistency Problem of Applying Graph Neural Network to Fraud Detection阅读笔记 文章标题:A ...

  3. A Semi-supervised Graph Attentive Network for Financial Fraud Detection 个人总结

    A Semi-supervised Graph Attentive Network for Financial Fraud Detection 个人总结 写在前面:为方便阅读,尽量使用中文总结,对于翻 ...

  4. 【工作】Amazon Fraud Detection

    Amazon Real-time Fraud detection: 亚马逊实时欺诈检测: Amazon Lambda AWS Lambda is a serverless, event-driven ...

  5. 【总结】反欺诈(Fraud Detection)中所用到的机器学习模型

    反欺诈(Fraud Detection)是指识别和预防欺诈行为的过程,通常是通过监视和分析数据来识别异常行为和模式.机器学习在反欺诈中发挥了重要作用,可以使用各种机器学习算法来建立预测模型.下面列举了 ...

  6. 论文 | Credit Card Fraud Detection Using Convolutional Neural Networks

    本篇博客继续为大家介绍一篇论文,也是关于用卷积神经网络 CNN 来进行信用卡欺诈检测的. 论文信息 论文题目:Credit card fraud detection using convolution ...

  7. 文献笔记 —— GIDS: GAN based Intrusion Detection System for In-Vehicle Network

    文献笔记 -- GIDS: GAN based Intrusion Detection System for In-Vehicle Network(GIDS: 基于GAN的车载网络入侵检测系统) 这篇 ...

  8. 论文笔记(SocialGCN: An Efficient Graph Convolutional Network based Model for Social Recommendation)

    一个有效的基于图卷积神经网络的社交推荐模型 原文链接:SocialGCN: An Efficient Graph Convolutional Network based Model for Socia ...

  9. IEEE-CIS Fraud Detection(一)

    IEEE-CIS Fraud Detection(一) 本博客是对kaggle上的一个检测欺诈的项目的top1方案的翻译,部分是博主自己翻译的,部分是机翻,中间会加上自己的补充,力求小白也能看懂. 题 ...

最新文章

  1. Maven的setting.xml配置文件详解(中文)
  2. 【Python】Label组件 Button组件 Checkbutton组件
  3. 【DOM编程艺术】动态创建标记(签)---创建和插入节点
  4. 【错误记录】Kotlin 编译报错 ( Type mismatch: inferred type is String? but String was expected )
  5. python画图角度_Python画图
  6. Python 运行时常见错误汇总
  7. 娱美德投入千万研发 揭秘韩国第一游戏引擎
  8. Java企业面试算法新得体会之3二叉树问题24问
  9. 离子量子计算机 寻址,量子计算机的硬件进展
  10. C语言课后习题(29)
  11. 【Clickhouse】Clickhouse 访问控制和账号管理
  12. struts2 拦截器_Struts 2拦截器示例
  13. 转:面试题收集——Java基础部分(一)
  14. 【下载】JavaScript高级程序设计(第3版).pdf
  15. 小森林顺序_电影:《小森林》两部
  16. Java 表格文字垂直居中_itextpdf中表格中单元格的文字水平垂直居中的设置
  17. excel冻结窗口_冻结窗口怎么冻结多行
  18. HDU P4699 Editor
  19. 摄像头M-JPEG 格式分析
  20. 网页访问时页面错误代码含义

热门文章

  1. SAP GRC 权限合规审计系统
  2. 风控成长之路---必知必会工具与业务
  3. python六十七课——网络编程(基础知识了解)
  4. TensorFlow实战5——TensorFlow实现AlexNet
  5. CentOS6 安装Sendmail + Dovecot + Squirrelmail
  6. 【linux】sed -e 's/-//g'
  7. 面向对象(类,面向对象三大特性)
  8. PHP curl 参数详解
  9. jQuery的DataTables插件的使用方法[转]
  10. c#不可忍受之慢——谁是罪魁祸首