某银行信用卡中心——大数据反欺诈应用案例

2017-06-23 10:54

本篇案例为数据猿推出的大型“金融大数据主题策划”活动(查看详情)第一部分的系列案例/征文;感谢 百融金服 的投递

作为整体活动的第二部分,2017年6月29日,由数据猿主办,上海金融行业信息协会、互联网普惠金融研究院联合主办,中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟、中国大数据技术与应用联盟协办的《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》还将在上海隆重举办【论坛详情丨上届回顾】

在论坛现场,也将颁发“技术创新奖”、“应用创新奖”、“最佳实践奖”、“优秀案例奖”四大类案例奖

来源:数据猿丨投递:百融金服

2003年以来我国经济的快速增长,国内信用消费环境的日趋成熟,我国信用卡市场近几年得到了爆炸性的大发展。根据中国银行业协会统计,截至2015年末,信用卡累计发卡量5.3亿张,信用卡欺诈损失排名前三类型为伪卡、虚假身份和互联网欺诈。

随着互联网信息技术的发展与移动互联时代的到来,信用卡业务的申请受理也逐渐由线下转移到线上渠道。某银行信用卡中心申请进件的重心,也逐渐向线上渠道倾斜。这就要求卡中心在审批流程和方法上与时俱进,采用更多渠道通过第三方服务,对申请进件的信用资质、真实性等方面进行核查,以防止欺诈行为的发生。

周期/节奏

1.2014年开始测试.

2.2015年上线第一版发卡模型,在网申行方A卡中分段的客群上使用。百融评分大于一定分数就发卡,初期控制总量,验证6个月后放量。

3.2016年改进版模型上线,全量查询百融,和自有评分组合使用。

4.2016年底,为满足人民银行征信中心合规要求,调整网申流程。进件通过百融初审,初审通过后邀请到网点面签,面签通过再查人行完成终审。

5.2017年针对纯线上样本再次优化模型,目前已完成开发,准备上线。

客户名称/所属分类

某银行信用卡中心/­风险控制­/反欺诈

任务/目标

信用卡业务竞争本质上就是客户的竞争,而且是优质客户的竞争。针对线上审批在客户发现、客户提升、客户保持、忠诚度、反欺诈和个人信用风险等等一系列围绕客户的新问题,支持日常运作的信用卡审批无法提供线上实时的、大量的、复杂的申请提供快速的决策分析,希望建立一套以客户为中心的大数据分析系统以实现上述目的。

挑战

今年两会上,总理在《政府工作报告》中指出,当前系统性风险总体可控,但对不良资产、证券违约、影子银行、互联网金融等积累风险要高度警惕。金融行业长期面临欺诈风险和信用风险,欺诈风险和信用风险有着本质的不同,信用风险指借款人因一些原因未能及时、足额偿还债务而违约的可能性,信用风险和收益一般是正向关系,金融机构对信用风险是主动承担的,风险管理的目的在于将风险控制在一定范围内而获得更好的收益。

而欺诈风险则是借款人恶意利用金融规则的漏洞以非法占有为目的,采用虚构事实或者隐瞒事实真相的方法,骗取借款的风险,金融机构是被动承担的,并不会从承担欺诈风险中获得交易收益,风险管理的目的在于将风险减少到最低和严防风险发生。但欺诈风险与信用风险又有一定的联系,欺诈风险可以引发新的信用风险或增大原有的风险程度,为风险管理带来一定难度。

金融反欺诈是指金融机构通过借助技术手段、改善业务流程等方式,检测、识别并处理欺诈行为,以预防和减少金融欺诈的发生。反欺诈在国内是个刚需,对很多金融机构来说,其所面临的欺诈风险远大于信用风险。尤其是近年来互联网金融和消费金融的快速发展,同时传统金融机构也不断向线上转移业务,很多平台等在风险管理方面准备不足即开展业务,面临大量的网贷申请欺诈和交易欺诈。同时对与p2p平台和消费金融公司来说,低廉的造假成本和风控能力较弱,大大降低了网贷申请过程中的诈骗难度,给其识别风险带了很大的冲击和挑战。

通过对各种场景中常见的欺诈行为的研究,可以对于外部欺诈的主要特征做出初步判断,欺诈行为主要可分为以下几大类:

1、身份欺诈,即利用虚假的身份信息向金融机构申请贷款。身份造假有以下几种类型:

第一,盗用或冒用他人身份信息,欺诈分子通过暴力破解、撞库等技术手段非法盗取网上银行/手机银行账户,并采用集码器等获取手机验证码等校验信息,利用账户资金进行非法消费、转账或提现等操作。

第二,盗用银行卡,即非法获取持卡人的银行卡信息,绑定支付账户,或者通过复制银行卡,提取银行卡内资金。

第三,虚假注册,即利用身份信息交易黑色产业链大量收购身份信息,在线注册账户,并利用虚假注册的非本人账户进行骗贷或洗钱,这类成本较低的欺诈方式主要用于攻击风险控制薄弱(例如提供身份证即可放款)的借贷平台。

随着放贷机构风险管理手段的升级,近期还有针对性地发展出“虚拟人物养成”的新模式,即花费时间和经济成本“刷”出各类信用记录,例如通过作弊手段,将芝麻信用分“养”到600分以上,创造出一个“真实”的有良好信用信息的人以骗取贷款。

第四,电信诈骗,即通过网络、电话等诈骗方式,诱使客户主动将资金转移到欺诈分子账户。在身份欺诈中,既有个人实施的单笔骗贷,也有专门的骗贷团伙,专门研究各个金融机构的管理漏洞,利用各种技术手段实施团伙欺诈,例如攻击某个平台,大量盗取用户信息,或通过一台主机同时控制几百部手机或平板电脑,或同一台手机不断插拔多个手机号进行申请,其手段更为隐蔽,从单一的身份属性验证角度难以识别此类团伙行为或机器行为。

2、信息隐瞒或造假,即刻意隐藏不良信息,或征信不达标的个人,在黑中介的协助下,通过各种手段将自己包装成“信用合格”人员,从而顺利获得贷款。例如申请人存在电信、公共事业、各类罚款等方面的欠缴行为,或者其名下个人资产是法院的执行对象等负面信息,或者其配偶在金融机构有过多次逾期或不良记录,即使申请人本人信用状况良好,但法律规定的代偿义务直接影响到了申请人的还款能力和意愿。由于婚姻关系不是申请表的必填信息,此类信息不对称具有相当的隐蔽性,难以被金融机构察觉。

另外,还有欺诈分子通过作弊手段,短时间内大幅提高芝麻分等信用记录,或伪造高学历证明、工作证明、通讯信息、银行流水信息等,试图提高信用审核的通过率。

3、隐形的欺诈意图,由于信用意识和超前消费的准备不足,一部分拥有正常信贷需求的人可能出现未能正确评估自身还款能力或丧失还款意愿的情况。申请人本人及其密切联系人(尤其是有代偿义务和代偿意愿的联系人)是否在新的贷款机构提交了借款申请,是否从新的贷款机构借款,借贷产品的类型和借贷渠道是否发生了变更等,尤其是从传统金融机构转向风控较为松懈的新型贷款机构申请贷款,或新申请了短期高息贷款,或频繁使用信用卡提现等异常现象,如果出现此类情况,有理由相信,在客户收入保持现有水平的情况下,难以偿还所有这些欠款,很大程度上能够反映出资金紧张或信用状况恶化,需要额外加以关注。

4、商户欺诈,商户与借款人形成套现、套利的勾结关系,骗取金融机构对于特定消费场景的补贴等。

实施过程/解决方案

技术要点及解决方案

随着网络和移动通讯技术在金融领域的广泛应用,网络欺诈也日益复杂多样,并呈现多种欺诈手段的复合型欺诈和分工精细的团伙化欺诈趋势。传统的反欺诈手段通常是每遇到一次欺诈,就将其行为特点记录下来形成“规则”,再基于规则建立防范机制,通过金融机构自有业务数据进行分析建模做反欺诈风控,但由于我国目前征信体系并不完善,数据滞后性和数据不全面问题导致金融机构只能做到一定程度的预防,不能跟上日益隐蔽和变化的欺诈手段,起不到真正的全面风险控制。

百融金服凭借服务银行等金融机构的行业先入优势、超强的大数据处理和建模能力,为信贷行业用户提供包括反欺诈、贷前信审、贷中管控以及贷后管理在内的客户全生命周期产品和服务。通过大数据的方式进行筛选、整合、聚类等处理,针对未来可能产生欺诈行为的异常信息进行判定,为用户做全方位画像,就成为金融机构防范欺诈风险和信贷决策的重要补充。

影响反欺诈效果的因素包括数据的来源及质量、 算法模型的有效性、 系统构架以及对应的反制措施。

图1 百融反欺诈框架

在反欺诈系统中,能否形成全面的用户画像, 进而对用户下一步的欺诈风险进行预测, 多维度和深度的大数据是必不可少的条件。

随着互联网和移动互联网渠道的不断发展,从各类场景识别欺诈行为的重要性将日渐突显。百融拥有详尽且经过检验的预置规则集,对于不同的业务场景,可以基于测试样本的测试效果,选择适用规则进行使用,还可以通过对金融机构具体应用场景和客群的特征分析,开发客制化规则并检验效果,择优选用、部署,确保贷前反欺诈效果。

图2 不同场景下的欺诈方式

一般来说,反欺诈模型有两种,一是使用大量欺诈样本,应用规则引擎及统计分析技术,进行多维度多规则的组合,根据对欺诈识别和预测能力的贡献,每条规则被赋予相应的权重,命中相关规则的行为会得到累积的分值,即对单次信贷申请行为的欺诈度的综合量化结果,从而来预测欺诈的概率。

图3 反欺诈­专家判断模型(规则引擎)

另一种是反欺诈机器学习模型,它指的是采用数据挖掘方法,基于历史(即已知的欺诈申请和正常申请)而建立的分类模型,通过机器训练利用海量数据来对借款人进行判断。

图4 反欺诈­机器学习模型

机器学习主要有两种学习方式,监督学习和无监督学习。监督学习模型,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型,具有对未知数据进行推测和分类的能力,比如在已知“好”和“坏”标签的前提下,尝试从历史数据中,挖掘出欺诈团伙的典型特征和行为模式,从而遇到相似的行为时可以分辨是否是欺诈团伙。

监督模型虽然在预测准确性上有不错的表现,但是,实际情况中,“好”和“坏”的标签往往很难得到。因此,在没有额外信息的时候,就需要通过无监督学习模型进行分析。无监督式学习网络在学习时并不知道其分类结果是否正确,也没有告诉它何种学习是正确的),仅提供输入范例,而它会自动从这些范例中找出其潜在类别规则。当学习完毕并经测试后,便可以将之应用到新的案例上。

在反欺诈规则引擎中,这些甄别欺诈行为的规则依赖于从大量历史案例中总结出来的“专家知识”,而机器学习模型采用更复杂的算法建立的模型,需要大量数据建立一个良好的训练集,以保证输出结果的准确。基于两类模型各自的优劣势,在应用其评分结果时,百融建议根据金融机构的实际情况,制定分阶段应用策略,并持续监控和改进模型。

图5 两种模型的应用策略

上文提到欺诈行为呈现团伙化特征,关系网络提供了全新的反欺诈分析角度,通过无监督学习算法,挖掘诈骗团伙的特征,从而识别诈骗团伙。

亚里士多德提出“人是社会性动物”,社会个体成员之间因为互动而形成的相对稳定的关系体系,关系网络关注的是人们之间的互动和联系,社会关系包括朋友关系、同学关系、生意伙伴关系、种族信仰关系等,经由这些社会关系,把从偶然相识的泛泛之交到紧密结合的家庭关系的各种人们或组织串连起来。

关系网络指的是一种基于图的数据结构,由节点和边组成,每个节点代表一个个体,每条边为个体与个体之间的关系。关系网络把不同的个体按照其关系连接在一起,从而提供了从“关系”的角度分析问题的能力,这就让我们可以从正常行为中识别出到异常的团伙欺诈行为。

图6 关系网络图

异常检测是在无监督模型学习中比较有代表性的方法,即在数据中找出具有异常性质的点或团体。在检测欺诈团体的情况下,异常检测被认为是比较有效果的。比如一般情况下在关系网络中,正常的个体应该是与另一个节点组成一度关系,如果出现与其它众多节点关系密切,关系在二度以上,且网络中有多个节点具有欺诈嫌疑,则这个关系网络的团体可以看作是异常,其每个节点均有可能是欺诈团伙的参与者,发生借贷行为时,可以进行重点审查或直接拒绝。异常检测并不能够明确的给出一个团体是否欺诈,但是可以通过这种方法排查出可疑的团伙,从而进行调查。

综上所述,从金融机构的业务流程来看,风险是存在于信贷行为的整个生命周期的,百融通过用户画像、反欺诈识别、信用评估等手段建立贷前审核、贷中监控、贷后管理的信贷全生命周期风控体系,帮助金融机构降低潜在风险。

图7 全生命周期管理方案

实施过程

1、客群分析

在建立模型前,百融金服将根据信用卡中心的业务模式和客户群体特征,明确客群分类,以此来确定模型的种类,确保模型准确性的前提下避免重复工作。根据信用卡中心的客群分析研究结果,识别其风险特征,确定与其信用风险强相关的变量,与百融金服进行联合建模。

2、客制化建模

在建模的过程中,百融金服的专业人员该信用卡中心的业务人员共同对贷前反欺诈、信用评估、建模、贷中监控等环节进行深入研究和探讨,及时根据其信用卡中心的需求对模型进行调整。

欺诈检测方面,通过收集和整理各行业、机构的黑名单信息,通过多样化的机器学习模型及大数据关联分析等技术,给银行、个人等企业提供风险管控和反欺诈的服务。

风险评级方面,使用专业技术和工具,评估风险账户相关数据的客观性、准确度,量化其信用风险、履约等能力;在控制风险前提下,使个人能够实现安全汇款。

建模方面,根据该银行信用卡的业务特征以及百融在同业的实践经验,本项目将主要采用广义线性模型框架下的逻辑回归模型来实现。逻辑回归模型具有稳定性高、解释性强、部署简易的优点,使得其广泛的应用于风险评估、市场营销等诸多领域。评分将基于科学且严密的建模流程,同时建模过程中将充分吸收百融金服积累的专家经验与行业经验,形成最终的最适用于其信用卡中心的定制化评分。定制化评分将助力其信用卡中心提升信用风险评估的精准性,提升审批效率和审核通过率。

贷中监控方面,发掘与相关账户的信用相关的预警信息,形成预警信号并向相关风险管理系统主动推送,进而跟踪预警信号处置流程,直至形成最终结论或风险管控方案,形成一个风险预警、通知、处置和关闭的闭环处理流程。

3、查询接口

百融将根据该银行信用卡中心的需求,提供网页查询和专线接口查询两种方式。

1)接口查询方式

百融提供相应的接口程序,接口可支持不同业务系统开发不同接口查询功能,保证拓展性的基础上,可实现单笔查询和批量查询两种功能,满足该银行信用卡中心发起一次查询返回所有结果的需求。其中,单笔查询和批量查询都可满足实时返回查得结果需求。

2)网页查询方式

百融将为该银行信用卡中心提供网页查询方式,用户可通过网页输入相关信息进行查询,网页版是百融自主研发的风险罗盘系统,同样支持单笔和批量两种查询方式。其中,单笔查询和批量查询都可满足实时返回查得结果需求。

结果/效果总结

百融征信局评分在银行客群上具有优秀的风险区分度和稳定的排序能力,与银行申请评分交叉使用后可以更精准得区分出好坏客户。对于无央行征信报告的客户,百融仍能对75%以上的客户实现风险区分,经过百融评分,找回了原本认为坏的客户,拒绝了原本认为好的客户,在保持通过率基本不变的情况下,审批通过率提升了8%,实现不良率由1.54%下降至1.25%,降低银行约20%的损失。

某银行信用卡中心——大数据反欺诈应用案例 2017-06-23 10:54 本篇案例为数据猿推出的大型“金融大数据主题策划”活动(查看详情)第一部分的系列案例/征文;感谢 百融金服 的投递 作为整体相关推荐

  1. 独家 | 大数据与AI技术助力金融科技:百融金服的探索实例

    [导读]本文选自百融金服CEO张韶峰和CRO季元于2017年9月14日晚在清华大数据"技术·前沿"系列讲座--大数据与AI技术在金融科技的应用上的分享.两位学长结合自己在金融行业和 ...

  2. 百融金服获2亿B轮融资 打造融合线上线下基因的第三方金融大数据公司

    ZD至顶网软件频道消息:10月20日,百融金服宣布获得2亿元B轮融资,百融金服CEO张韶峰宣布了公司的总体战略规划:百融金服将从大数据风控与营销模型.数据维度和来源.产品体系和品类.服务对象和领域上建 ...

  3. 百融金服榕树FICO信用评分,百融金服榕树数据+模型服务

    百融金服榕树大数据风控,作为一项新兴服务,可对标美国市场.美国个人征信行业格局稳定,百融金服榕树三大征信局提供数据,FICO提供信用评分.模型服务,彼此很难进入对方的领域. 百融金服榕树提供模型服务, ...

  4. 招聘 | 百融金服招贤纳士:社招实习生多岗位

    百融金服是一家利用人工智能.风控云.大数据技术为金融机构提供智能风控服务的智能科技公司.公司于2014年成立,股东背景雄厚,包含国家主权基金.中金公司,华融资产,红杉,高瓴.IDG等顶级投资机构共投资 ...

  5. 百融金服榕树_百融金服榕树成为拉动新金融行业增长的主力军

    百融金服榕树已经拉动整个金融行业的主力军.他们的产品服务主要是信贷审批,它是结合很多数据,依赖于用户评估报告帮助审批进行控制,个人观点是一家很值得信赖的公司.百融金服榕树我个人之前在那里实习过,真的是 ...

  6. 百融金服、趣店、中航信面试总结

    百融金服: 总体面试官很好,一共三个人面我,一个leader,两个员工,一起面: 自我介绍基本必不可少 1.逻辑回归的推导 2.参加竞赛的讲述(要细致,我每次面试都会带上纸和笔方便讲述) 3.项目的评 ...

  7. 百融金服榕树采用高性能ADC、DAC和超大容量固态FLASH

    百融金服榕树超宽带信号高速采集记录存储回放系统主要用于对超宽带信号进行长时间高速连续实时采集记录和回放产生,适用于雷达.无线通信.软件无线电.电子对抗.电子侦察.卫星导航.复杂电磁环境模拟信号的高速采 ...

  8. 大数据反欺诈技术架构

    一年多以前,有朋友让我聊一下你们的大数据反欺诈架构是怎么实现的,以及我们途中踩了哪些坑,怎么做到从30min延迟优化到1s内完成实时反欺诈.当时呢第一是觉得不合适,第二也是觉得场景比较局限没什么分享的 ...

  9. 银行信用卡中心通常关注哪些用户运营指标?

    银行信用卡中心日常关注的用户运营指标应包括以下几项: 1. 系统效果满意度 指用户对某个系统的功能和性能表现的满意度,通常通过用户调查.反馈和评价等方式进行评估.该指标可以综合评价系统的整体性能和用户 ...

最新文章

  1. 有没有哪些数学猜想是验证到很大的数以后才发现是错的?
  2. 安装server 2012 时提示输入的密码不满足网络或组管理员设置的密码复杂度
  3. 一步一步教你在 docker 容器下使用 mmdetection 训练自己的数据集
  4. chm转pdf_简历是以PDF还是Word格式提交的?
  5. servlce与filter的url-pattern介绍
  6. python matplotlib绘图大全(散点图、柱状图、饼图、极坐标图、热量图、三维图以及热图)...
  7. 算法题目——电梯(HDU-1008)
  8. 高效率人士的日常习惯
  9. 平安性格测试题及答案_性格趣味小测试题 有趣的心理测试题大全及答案
  10. [EasyHexo 专栏] #1 - Markdown 编辑器推荐与语法简介
  11. 树组件:主要配置项、属性、方法
  12. 免费书籍库,供大家收藏
  13. Windows系统重装教程完整版(系统备份、系统还原与重装)
  14. 基于docker1.7.03.1单机上部署hadoop2.7.3集群
  15. 360云盘 linux客户端,360安全云盘Linux界面版下载,包括深度版,支持龙芯/兆芯/飞腾芯片...
  16. 关于matlab 画水平线
  17. 你知道哪六种传统早餐不能吃吗?
  18. steam饥荒服务器配置修改,启动服务器_饥荒联机版快速配置Dedicated Server攻略_饥荒联机版怎么配置服务器_游戏堡...
  19. 嵌入式arm linux工控机,ARM工控机和X86嵌入式工控机的区别
  20. 电子商务学计算机为什么,千万不要学电子商务(大专学的计算机专业就业难吗)...

热门文章

  1. staruml无法打开mdj文件_StarUML使用说明
  2. java子网划分_子网划分讲解及练习(二)
  3. 局部图像描述子——Harris角点检测器
  4. 贷款违约预测--赛题理解
  5. 深入浅出让你理解什么是LLVM
  6. numpy a[...,:2]
  7. Google Cloud API 验证
  8. js动态载入css文件,原生JS动态加载JS、CSS文件及代码脚本(示例代码)
  9. pytorch笔记 pytorch模型中的parameter与buffer
  10. Meanshift解析