揭秘消费金融之反欺诈
伴随肺炎疫情,消费金融行业最近并不安生。各路媒体薅羊毛、蹭热点、夹私货的不少。其中,最受追捧之一就是预言行业发展前景,意淫资产质量波动。
拐点还没到,资产质量波动究竟几何?除了各机构风控、高层和对应的监管机构,能被媒体知晓并报道的,基本都是放长线,狠打脸。
猎奇信息快餐,传播焦虑,不如来探究影响资产波动的原因,最重要的一个便是欺诈风险倍增。
在消金风控江湖里,信用风险和欺诈风险,一个是罗纱掩面却光明正大的挑战者,另外一个则是藏身暗处且招招致命的刺杀者。
信用风险主要通过各种方法判断用户的还款能力和还款意愿。它就在那里,等你用可触及的手段搜索数据,用逻辑工具分析判断,最后在风险与利润之间寻求平衡。
欺诈风险,则完全不同。刺杀本就不择手段,杀人成功、绝尘而去才是惯见场面。贷款欺诈的目的是骗贷,所以反欺诈更像一场敌暗我明的不对称战斗。剑一出鞘,必鲜血侍之。
随着消费金融行业的兴起,欺诈风险控制行业水涨船高, 专业反欺诈人才供不应求,市场薪酬价值可到百万,究其原因是这个领域的“新”。
所谓新,主要缘于3个方面:一是传统从事刑事案件侦查的探员型人才熟知线下诈骗套路,多偏向于电信诈骗,对信贷申请的欺诈场景并不熟悉;
二是信用卡和消费金融公司的反欺诈人员多是经济学、统计学类算术型学科,对科技并不熟悉;
三是反欺诈从业者较少有机会涉足真实的黑产市场,对欺诈手法的演变和欺诈事件的爆发并不具备敏感性,无法行之有效及时的做出应对措施。
欺诈分类
兵者云:知己知彼,百战不殆。欲反欺诈,必先知之。
白户风险:借款人信息缺失,没有足够的数据来对借款人进行风险评估。包括内部白户(新注册用户、无申贷历史记录)和外部白户(央行征信、第三方民间征信无覆盖)。由于从未或较少有申贷记录,因此黑名单规则、多头规则等都会失效。在对待白户时,应当谨慎其被黑产利用的可能。
黑户风险:借款人存在逾期、失信、欺诈的记录。包括内部黑户(历史多笔订单出现逾期、在途订单催收失联等)、外部黑户(央行征信花/黑、第三方民间征信黑)。出于炫耀等心理,很多黑户会在口子论坛、QQ群等交流撸贷经验,因此可通过论坛舆情监控、黑产群卧底等来发现新的作案手法。
伪造风险:借款人通过伪造资料,蓄意骗贷。例如,伪造账单流水记录来企图骗取更高的额度。一般都是借款老手,熟悉各平台流程,深谙套路。恶意欺诈人群往往到处借钱,广撒网来提高放款概率。同时,可能涉及不良嗜好(黄赌毒)。
身份冒用:伪冒他人身份进行欺诈骗贷。包括熟人冒用(亲戚朋友、同学等)和他人盗用(购买他人四件套、个人隐私信息泄漏等)。一般可通过信审、人脸识别、活体验证等方式来核验借款人身份。
中介风险:黑中介哄骗或招揽客户实施骗贷,对平台风控漏洞进行大规模攻击,造成巨大资损。黑中介可利用白户轻松突破风控防线,并骗取白户的高额手续费。黑中介通讯录一般会存客户的号码;若是远程贷款操作,可能会采取视频通话、翻拍照片来应对活体识别核身。
传销风险:有组织地开展收费并发展多级下线,存在集中骗贷的风险。给成员洗脑诱导骗贷,同时不断以拉新会员费来给老会员发工资,从而扩大规模。由于老客拉新,从关系网络上观察具有明显的星状结构。
内外勾结:骗贷人与放贷机构内部员工因为利益勾结。机构员工熟悉内部风控规则和漏洞,利用这些漏洞与外部骗贷者合作,诱骗风控审核通过,骗取贷款本金。内外勾结一般是窝案居多,外部偏带者多为专业黑产、骗贷机构。单笔金额较大,且连续笔数多。
反欺诈体系
高手过招,七步之内,生死立判。反欺诈作为风控体系中不可逾越的底线,与信用风险控制体系截然不同,它的逻辑体系可谓极简:凡识别为欺诈者,斩立决。
决胜千里,在运筹帷幄。如果说反欺诈的策略是道,那么反欺诈的模型和算法就是法和术。道、法、术由上至下,辅成与共。而数据,作为一切逻辑得以实现的基石,就像空气、时间或者重力。四者合璧,形成反欺诈的闭环世界。
反欺诈策略
在反欺诈的世界里,华山论剑的侠客不少,杀敌制胜的招数无限。反欺诈策略,更像是习武最初修炼的内功心法。当内力盈满,无论何门何派武功,学起来都会事半功倍。主流的反欺诈策略有信誉库、专家规则、机器学习三种。
信誉库:指传统的黑、白名单,通过内部积累、外部获取的各种人员、手机号、设备、IP等黑白名单对欺诈行为进行判断,是一种简单、成本低的反欺诈手段。
专家规则:基于反欺诈策略人员的经验和教训,制定反欺诈规则。当用户的操作请求和行为触发规则时,即被认定为欺诈行为并启动拦截。
机器学习:通过机器学习的方法,将用户各个维度的数据和特征,与欺诈建立起关联关系,并推算出欺诈的概率。
有监督的机器学习会将历史上出现的欺诈行为进行标记,利用逻辑回归等算法,结合海量用户行为特征,识别欺诈行为。
无监督的机器学习不需要预先标记欺诈行为,而是通过对有操作行为各维度数据和标签聚类,找出差异行为,予以拦截。
反欺诈模型与算法
内功内化于心,拳术剑法外化于形,内外兼修,方能制胜。反欺诈模型就像武林各派武功,而算法就像纷繁复杂的招式。终极目的为制胜,在反欺诈的江湖里,从一而终者寡,而杂糅百家、取长补短者多。
常用的模型 有FPD模型、评分卡模型、多元判别分析模型、Logistic回归模型、神经网络模型、决策树模型等。
举例:FPD (First Payment Delinquency)首次还款逾期模型通常作为兜底模型,内在原因是欺诈一旦得逞,首次还款即逾期,所以首逾率也通常被视作欺诈的一个重要指标。
常见的算法 包括数据挖掘算法、社区发现算法、深度学习算法等。
举例:数据挖掘算法是根据数据创建数据挖掘模型的一组试探法和计算。为了创建模型,算法将首先分析提供的数据,并查找特定类型的模式和趋势。
(大)数据道生一,一生二,二生三,三生万物 – 《道德经》。在反欺诈体系里,数据就是一。
大数据的分类,涵盖资质数据、社交数据、交易数据、行为数据等,不再赘述。
而数据之所以为基石,是因为多数实际情况下,数据的量级并不能达到理想要求。底层的算法、模型和策略需要根据数据的可获得性调整。反之,对数据清洗和使用的逻辑,会对产出的结果造成实质影响。
举例:关于社交数据如通讯录、运营商数据,采用基于图的社区发现算法(如Louvain)来发现团伙。关于埋点行为数据,利用LSTM、Word2Vec等算法来生成行为特征。
典型风险事件渠道
兵者,诡道也 – 《孙子兵法》
反欺诈模型的迭代和欺诈黑产的反制更新,就是一场典型的猫鼠游戏。无间之道,没有成规可寻。
实时大盘监控:基于订单、用户维度,监控设备聚集性风险(LBS、Wi-Fi)、地域欺诈风险(如朋克村)。大盘监控对于识别黑中介风险、传销风险等团伙欺诈相对更有效,需要设置报警阈值,并人工介入分析。
信审催收反馈:信审通过电话外呼,核验客户身份,咨询借款动机,往往会发现某些欺诈用户。例如,身份伪冒风险场景中,借款人支支吾吾无法正确回答问题。催收中发现失联用户等,这些关联部门的案件将反馈至风控调研组。
论坛舆情监控:通过对各大口子论坛、戒赌吧、上岸交流区等内容,提取近期市场动向。特别是需要去理解欺诈人群的心理特征、社会身份等。
揭秘消费金融之反欺诈
黑产卧底调研:线上渠道可尝试加撸口子QQ群、网贷中介微信等方式,利用老手们的集体智慧,以及网贷中介的丰富经验。站在对方的立场上,更会发现己方风控系统的弱点。线下渠道可去一些欺诈案件多发地,实地调研来学习黑产的手法。
设备反欺诈策略与业务实际的错配
作者在近几年的工作中,了解到一些公司在做反欺诈方面的心得和体会,也有聊到一些反欺诈策略设置方面的问题。
我发现这里面有80%的策略是相似度很高的,例如很多策略人员会部署“是否使用模拟器借款”这个规则。
因为黑产经常会用PC模拟手机设备申请贷款,规则本身没错,而有些人并不了解一件事,有些APP是不支持X86处理器运行的,几乎所有的PC是X86处理器的配置,而手机设备是ARM处理器的配置,如果你的APP是只支持ARM架构的,当你把apk文件拖拽到模拟器加载列表时,就会发现系统无响应。
多数做策略的人并不是科技开发人员出身,对于软件、硬件、环境信息、网络资源、设备指纹算法,以及这些信息技术的发展演变趋势并不十分了解,造成了策略与业务实际的错配。
大概两年前,有一家做设备指纹厂商的咨询专家在介绍设备指纹技术的安全性时,提到了通过检测一键改机软件识别设备指纹是否被篡改的问题,而很多策略人员也部署了一条名为“是否安装了一键新机软件”的规则,而其实随着隐私安全要求的不断提升,很多机型已经无法获取root权限。
也就是说即使安装了AWZ、NZT这些软件,也无法达到篡改信息的目的,反而会出现误杀,即使是已经root的设备,缺少Xposed框架的NZT也是无效软件。
再退一步说,篡改信息还不一定要通过下载软件实现,网上有很多免费的生成IMEI、SN的软件,所以外部导入文件也可以达到修改的目的,所以这类策略的效果我始终打个问号。
建议大家在使用这些设备指纹技术的时候,还是要深入了解底层的技术原理和算法逻辑,拿设备ID的生成算法来说,目前最多使用的还是相似度算法,除了使用硬件、软件、环境信息、网络信息变量进行设备ID的生成外,聪明的制造商还会事先定义多组DeviceId编码,所以即使你恢复了出厂设置,或者重置了你的IDFA,也可以再次追踪到你的设备。
其实再完美的技术都有可能被破解,如果不考虑成本,破解设备ID也并非难事,尤其是在网页、H5端,但当业务发展到成熟期,高质量的自有数据一定是比设备指纹技术更加有效识别风险,大家不妨尝试关联关系挖掘和区域分割。
尾声
有人的地方就有江湖,有江湖的地方就有欺诈。人心有多善良,就有多险恶。欺诈与反欺诈,是人性的较量,不灭不息,永恒存续。认清这点,许多事自然得解。
最后分享一个彩蛋故事,关于人类与技术反向破解。
一个有严重路怒症的德国老头,每次开车出门时,后座上总是堆叠着99部旧手机,全部打开谷歌地图。当聪明人用最智能的手机实时查询交通路况,用最复杂高效的算法算出最优路线,从而节省5分钟时,老头却一路驰骋,悠然驶向目的地。
揭秘消费金融之反欺诈相关推荐
- 互联网金融领域反欺诈技术已发展到哪一步?
http://www.ce.cn/xwzx/gnsz/gdxw/201711/13/t20171113_26835875.shtml 近日,在JDD大会上,京东金融集团副总裁.技术研发部总经理曹鹏介绍 ...
- community 计算模块度_【转载】金融风控反欺诈之图算法
随着量化宽松和经济复苏,商业银行消费金融进一步发展,在移动支付.大数据.人工智能等技术快速发展的背景下,消费金融领域开展了诸多创新,金融借贷业务发展迅速. 先介绍下金融借贷业务流程:用户前来申请借贷, ...
- 如何利用IP地址开展金融反欺诈?
"用明天的钱,原今天的梦"."融化烦恼.贷来快乐",如今,我们随处可见这样诱人的广告语,我国互联网金融行业迎来了爆发式发展,甚至传统的商业银行也都纷纷推出自己的 ...
- 如何构建 FinTech 科学反欺诈体系|架构师实践日
微众圈 > 微信资讯 > 科技 > 文章 如何构建 FinTech 科学反欺诈体系|架构师实践日 摘自公众号:七牛云发布时间:2017-4-11 21:28:33 FinTech,即 ...
- 中科院、MIT等5大专家解读黑瞳:金融业幕后的新一代反欺诈卫士
2018年12月18日16时,上海,3℃. 黑瞳科技发布会的现场,穿过外面的低温,走过"一道黑科技时光隧道",人们进入了另一番天地. 这个冬天,对于许多公司来说,真的很冷.但在这里 ...
- DataVisor进入中国一周年 成为人工智能大数据反欺诈行业领先者
9月21日,全球领先的人工智能公司DataVisor在北京召开媒体见面会,详细介绍了进入中国一周年所取得成就和进展.在新闻发布会中,DataVisor的管理团队与客户分享了对社交网络.电商.金融领域反 ...
- 开播了!大行都在用的最新反欺诈技术大揭密!
金融反欺诈业务的数字化转型驱动因素有哪些变化? 图技术从哪些角度革新申请反欺诈业务? 有哪些前沿的反欺诈实践案例与方法论? Galaxybase吸引众多厂商使用的优势是什么? 聚焦金融领域反欺诈业务, ...
- Maxent猛犸反欺诈:运用人工智能打造多层级业务安全架构
上海2017年1月9日电 /美通社/ -- Maxent猛犸反欺诈CEO张克在1月6日在沪举行的金融科技峰会发表演讲,与业内精英共同分享人工智能反欺诈建设多层级的智能化业务安全架构思路. Ma ...
- 【风控术语】数字金融反欺诈技术名词表
转自:https://blog.csdn.net/hajk2017/article/details/80866115 感谢博主分享 另附Tech Fin微信社群,感兴趣可添加微信wu805686220 ...
- 某银行信用卡中心——大数据反欺诈应用案例 2017-06-23 10:54 本篇案例为数据猿推出的大型“金融大数据主题策划”活动(查看详情)第一部分的系列案例/征文;感谢 百融金服 的投递 作为整体
某银行信用卡中心--大数据反欺诈应用案例 2017-06-23 10:54 本篇案例为数据猿推出的大型"金融大数据主题策划"活动(查看详情)第一部分的系列案例/征文:感谢 百融金服 ...
最新文章
- RESTful之分页Pagination
- pl/sql显示乱码
- python自动补全库_叼炸天的库! 自动补全 Python 代码,能节省 60% 敲码时间
- Django MPTT —— 概述
- NSDictionary 、 NSMutableDictionary
- macOS NSTableView
- iphone4 短信截获
- 组件化与插件化的差别在哪里?附面试题答案
- leetcode 279. 完全平方数(dp)
- 转义字符简析及注意事项
- 深度学习《CycleGAN》
- BZOJ 3224 Treap
- 安装+wordpress+出现403+forbidden_Linux安装 Pure-ftpd
- 四 Lync Server 2013 部署指南-前端部署(1)
- 前端程序员 学习书籍推荐
- 云南数据中心机房资源介绍、IDC资源分布,机房数据中心建设解决方案
- 大数据之 Hive 教程
- 小白轻松使用axis2构建webservice
- 【php学习之路】微信公众帐号
- 生命主题dreamweaver作业静态HTML网页设计——卫生与健康 6页 带视频