人们常说,有人的地方就有江湖。而我们要说,有江湖的地方就有欺诈。反欺诈由来已久,从最原始的人工检测,到后来的黑白名单、规则引擎、有监督学习算法,再到现如今的无监督学习,演化至今,欺诈与反欺诈手法可谓变化多端,此消彼长。常言道,道高一尺,魔高一丈。这句话用在欺诈与反欺诈行业再合适不过了。在巨额利益的诱惑下,欺诈者不断扩充队伍,升级技术,变化攻击方式,给个人和企业带来了巨大威胁。

在与欺诈分子斗争的诸多年间,反欺诈不断形成了自己的方法论。具体都有哪些方法?都适应哪些场景?哪种方法更有效?且听黄姐姐娓娓道来。

方法一、黑白名单

黑白名单是最原始的反欺诈手段,顾名思义,黑名单就是坏人,白名单则指好人。举个?:人行征信记录着每个信用卡持卡人的还款记录,如果你有信用卡逾期且拒绝还款,甚至直接从人间蒸发,那么恭喜你,你可能就上了人行的黑名单。一段时间后,你重新在江湖上复出,想着:申请个新信用卡吧!银行在接到你的申请表后,在黑名单上一查,发现了你,于是乎,驳回!这就是黑名单的使用方式。黑名单的应用非常广,且一份黑名单通常能卖到很高的价格,例如:你经常在淘宝上购买退货险,又屡屡退货,那么,你就有可能上了骗保的黑名单,想再次购买退货险就很难了。

方法二、规则引擎

黑名单的优缺点十分明显,优点就是简单方便,各行各业各产品的反欺诈都可以用黑名单,缺点就是无法发现新骗子。黑名单的升级版本是规则引擎,还是拿退货险举例。之前,保险公司拿着一个清单来比对哪些人可以购买退货险,经过一段时间的积累,保险公司发现,退货比例超过80%的用户极可能再次退货,疑似骗保;或者连续退货超过5次的用户的骗保嫌疑也非常大。于是乎,保险公司设定了一个阈值,规则如下:

1. 连续退货5次的用户,拒绝其购买退货险;

2. 退货比例超过80%,拒绝其再次购买退货险。

很明显,只要符合这两种规则的任何一个,就会被保险公司拒之门外。这相比于黑名单,可以检测到新的欺诈者,算是进了一大步。但是,规则引擎却无法检测到新的欺诈模式。假设,通过不断的测试规则,我发现了这个阈值。于是乎,我准确控制自己的退货率在79%以下, 便可以继续自己的骗保生涯,躺着赚钱了。一段时间后,保险公司再次发现了我的伎俩,于是把阈值下调到50%。

规则引擎通常可配合黑名单一起使用,通过规则引擎抓到的坏人被列到黑名单中。

规则引擎的规则是如何生成的?答案是:经验!这听起来有点不靠谱,万一经验错了怎么办?事实上,的确会发生这样的情况。例如,通过我们之前的经验判断,认为退货比例超过80%的就是坏用户。那么,假设我是一个网购新人,第一次买衣服,发现号码小了,于是退货。那么,我购买的第一单就退货哦,退货比例100%,能说我就是骗保的吗?下次就不让我买退货险了?这显然不符合逻辑!

正因为经验的不确定性,规则通常需要投入大量的精力维护,不断更新、修改、删除、添加等等,否则就会造成大量的FP和FN。

方法三、有监督学习

有监督学习是应用最为广泛的反欺诈方法。有监督学习通常需要大量的有标签数据来训练模型,以此来预测还未被标注的数据。拿垃圾邮件举例,假设你把5000封已经由人工确认过的垃圾邮件输入到了模型,告诉模型:hey,这些是垃圾邮件,帮我分析下!于是模型开始工作,通过对标题的识别,对邮件内容句子的分割,关键词的识别等各种分析方法,找到了某种你没办法说得清楚的内在关系。为了方便说明,我尝试把这种关系抽象出来:

标题里有“福利”二字的,有90%的可能性是垃圾邮件;

内容里有“汇款账号:xxxxxx”的,有10%的可能性是垃圾邮件;

一次性发送超过200封的,有60%的可能性是垃圾邮件;

回复率低于10%的账户,有70%的可能性是垃圾邮件;

这里,百分之多少称为权重。

训练好后,你给模型一封新邮件,模型通过检测以上各个子项,并对每一个子项乘以权重后相加,就得出一个分数,例如,这封有80%的可能性是垃圾邮件。

以上就是一个有监督学习的抽象过程,其中一个重要的步骤就是通过不断的迭代计算每一个子项应该被赋予的权重值。权重值计算好后,就可以说这个模型训练好了。

有监督学习的好处也十分明显,它可以帮我们分析隐层关系。我们可以不必知道到底有监督是如何做分析的,每一个子项被赋予了多少权重,我们只需要知道符合某种规则的就是坏人。此外,有监督还有助于处理多维数据。由于规则是人凭经验产生了,而如果老板丢给你一组数据,每一条数据都有多达500个字段,让你凭肉眼看出其中的关系,你恐怕要抓狂了。此时,有监督就可以解决你的问题了。

但有监督也有一个明显的弊端,每一个模型都需要大量的训练数据,训练一个模型也需要较长的时间。现在的骗子是何其聪明啊,到处打游击战。在你发现有入侵者后,你立马开始训练模型,然而,再你还没有训练好,骗子们可能就已经离开,开始找下一个目标了。如此,有监督便无法应对复杂多变,诡计多端的欺诈者了。

方法四、无监督学习

近年来,无监督为反欺诈打开了新大门,主要方式有聚类和图形分析。无监督无需任何训练数据和标签,通过发现用户的共性行为,以及用户和用户的关系来检测欺诈。下图描述了聚类的方式:

有这样一群用户注册事件,我们通过聚类发现其几个小群符合某些共性:例如:注册时间集中,都使用了某操作系统,某一个浏览器版本等。这个用户任何一个单独拿出来分析,看上去都是再好不过的用户了,而如果其符合某种超乎寻常的一致性就十分可疑了。例如,你发现一群人在凌晨2点-3点,采用chrome浏览器注册了某产品,其ip的前20位相同,GPS定位小于1公里,且注册后都去修改了昵称和性别。如果一个人这么做,你觉得正常啊,某个夜猫子随便逛网站而已。而如果一群人这么做,你心里恐怕就要犯嘀咕了吧!

下图描述了图形分析的方式:

为了解释分析逻辑,还是拿垃圾邮件举例。一个正常的邮箱,往来信件比例不会相差特别离谱,中国有句古话“来而不往非礼也”!你收到人家的一封邮件,回复一下“well received”是起码的礼仪。而我相信你基本上不会回复任何一个垃圾邮件或广告邮件,而是直接删除吧!通过回复率来判断垃圾邮件也是一个常用的方式。

图中,左下角是一个低端的攻击者,只是单纯地发送大量垃圾邮件,而邮件的回复率几乎为0,对于这种邮箱,我们很容易判断其为垃圾邮箱。右下角的群体就聪明多了,他们通过互相间的往来邮件来增加回复率,告诉反欺诈者:看,我有收到邮件哦!人家有回复我哦!你可不能抓我!这些邮箱通常互加好友,互通邮件,以此来伪装成正常用户。

通过无监督学习,我们可以发现这种类型的伪装者,将其一网打尽。

无监督算法应用于反欺诈检测,通常还有一个优势,那就是提前预警。现在聪明的骗子都知道要潜伏一段时间再发起攻击,以免太容易被发现。而由于其在潜伏期的行为依然符合某种规律,具有某些一致性,所以同样还是会无监督算法捕捉到。在攻击发生前就指认骗子,这一点,其他三种方法恐怕是望尘莫及!这也是无监督之所以在反欺诈检测大放光彩的重要原因之一。

可见,反欺诈手法无分优劣,选择适合自己的就是最好的!

如果你的欺诈问题非常多,不妨将所有方法综合起来用,建立一个全栈式检测平台。

【采用】反欺诈之四大杀器相关推荐

  1. 【采用】如何搭建反欺诈策略与模型

    信用风险与反欺诈哪个更加重要?为什么是先讲策略再谈模型?一个完整的反欺诈流程如何搭建?如何说服CEO接受模型测试成本?在一本财经商学院举办的第二期风控闭门课程上,天创信用首席科学家陈黎明一一做出解答. ...

  2. 中科院、MIT等5大专家解读黑瞳:金融业幕后的新一代反欺诈卫士

    2018年12月18日16时,上海,3℃. 黑瞳科技发布会的现场,穿过外面的低温,走过"一道黑科技时光隧道",人们进入了另一番天地. 这个冬天,对于许多公司来说,真的很冷.但在这里 ...

  3. 【勉强采用】反欺诈四大手段一秒get

    人们常说,有人的地方就有江湖.而我们要说,有江湖的地方就有欺诈.反欺诈由来已久,从最原始的人工检测,到后来的黑白名单.规则引擎.有监督学习算法,再到现如今的无监督学习,演化至今,欺诈与反欺诈手法可谓变 ...

  4. 【不采用】人工智能如何帮助银行反欺诈

    近年来,伴随移动互联网.虚拟现实等技术的飞速发展,银行服务模式日趋多样化.在客户享受灵活便捷服务的同时,银行欺诈风险呈现出更加隐蔽.专业的特点,发展出更多的作案手法和表现形式.传统欺诈检测通常依赖专家 ...

  5. 【采用】人工智能如何帮助银行反欺诈:银行智能欺诈风险预测模型研究

    近年来,伴随移动互联网.虚拟现实等技术的飞速发展,银行服务模式日趋多样化.在客户享受灵活便捷服务的同时,银行欺诈风险呈现出更加隐蔽.专业的特点,发展出更多的作案手法和表现形式.传统欺诈检测通常依赖专家 ...

  6. 【采用】互联网反欺诈体系建设

    转:原文链接:https://mp.weixin.qq.com/s/sBvqIfxNDoMlWhO6_z65Ww 这篇文章和上一篇[互联网反欺诈体系漫谈]:https://mp.weixin.qq.c ...

  7. 【勉强采用】反欺诈之血缘关系分析和犯罪传导监测

    文前小故事:隔壁阿姨最近总是带个包鬼鬼祟祟地出去,妈妈好奇,今天跑过去串门,问她最近在忙什么,她一下就忍不住哭了起来:我被人骗了--好多人去要钱--我把我姐和我女儿也坑了--那是我姐夫的安葬费--还有 ...

  8. 【采用】反欺诈之血缘关系分析和犯罪传导监测 - 知识图谱

    近期,一银行找到我,说他们现在有一个立项,题目是<数据血缘关系智能分析和犯罪风险传导监测>,希望听听我的建议.今天正好听到妈妈跟我说起这件事,就想,还是针对这个课题,好好整理下思路,讲一讲 ...

  9. 【采用】无监督学习在反欺诈中的应用

    一.反欺诈技术的发展历程 反欺诈技术的的发展经历了四个阶段,第一阶段黑名单.信誉库和设备指纹:第二阶段规则系统:第三阶段有监督的机器学习:第四阶段无监督的大数据欺诈检测.目前来说,前三种还是大家应用最 ...

最新文章

  1. 全球范围快速成长未来十年是SaaS发展的黄金时期
  2. Servlet中的生命周期方法
  3. Mybatis like查询的写法--转载
  4. Thymeleaf循环遍历
  5. Async/Await替代Promise的6个理由
  6. 2020数字中国创新大赛-智能算法赛-冠军方案
  7. 相机标定(二)深入理解四大坐标系与其变换关系
  8. LINUX环境搭建:安装中文定制版UBUNTU 10.10
  9. commons-lang常用方法
  10. mpi4py安装报错error: Cannot compile MPI programs. Check your configuration!!!
  11. ARM汇编指令(ARM工作模式、寄存器)
  12. Java并发包下的CAS相关的原子操作
  13. [翻译]Hystrix wiki–How it Works
  14. 将商品金额小写转换成大写
  15. Path of Equal Weight (30 分)
  16. 扩展欧几里得算法求逆元c语言,利用扩展欧几里得算法编程求逆元
  17. HashMap HashTable和CurrentHashMap的区别
  18. python中ix用法_Python Pandas DataFrame.ix[ ]用法及代码示例
  19. 新年贺卡php,PS制作漂亮的新年贺卡 -电脑资料
  20. Flex ANE介绍

热门文章

  1. Cortex-M3内核的指令系统
  2. wp-login.php 404页面,wordpress隐藏后台登陆界面,自动跳转首页或404
  3. 中继器 删除行_Axure9实操教程9-中继器动作(二)
  4. EventBus3.0 List事件遇到的坑
  5. matlab路面,赛道道路路况分析问题 matlab高手进下
  6. CCF-CSP 201903-2 二十四点 Python语言 模拟栈实现
  7. vue里面怎么删除部分页面_基于VUE选择上传图片并页面显示(图片可删除)
  8. Translating Embedding for Modeling Multi-relational Data
  9. pandas 知识点补充:绘图plot
  10. 强化学习笔记2:序列决策(Sequential Decision Making)过程