作者:个推高级数据工程师 晓骏

众所周知,金融是数据化程度最高的行业之一,也是人工智能和大数据技术重要的应用领域。随着大数据收集、存储、分析和模型技术日益成熟,大数据技术逐渐应用到金融风控的各个环节。个推作为专业的数据智能服务商,拥有海量数据资源,在智慧金融领域也推出了相应的数据解决方案-个真,为金融客户提供智能反欺诈、多维信贷风险评估和高意愿用户智能筛选等全流程的数据服务,助力各金融机构全面提升风控能力。本文将围绕大数据风控,结合个推实践,介绍金融风控机器学习的基本流程、算法实践和产品化建设等内容。

风控流程 & 多维度特征

大数据风控的内容

数据是风控的核心要素,大数据风控实际上就是对数据的处理、建模和应用的过程。大数据风控的流程主要分为四个阶段:数据获取、数据分析、数据建模、风控产品应用。对获取到的海量数据进行清洗和挖掘,有针对性地对金融特征进行深加工;接着通过规则策略和模型算法的构建,对外输出相应的风控服务。

个推以消息推送服务起家,为数十万APP提供高效稳定的推送服务,并沉淀了丰富的数据资源,覆盖超过40亿终端设备,数据全面、广泛且有深度。利用设备基础信息、线上APP偏好数据、线下场景数据以及外部补充数据,个推构建了8个维度、350+特征,同时对特征进行动态更新。基本属性、资产、金融、行为偏好、社会属性、消费偏好、风险和稳定性构成了个推金融数据的八大维度;个推利用数据的八大维度,逾350种特征进行模型构建,并将其应用于金融风控各环节。

金融风控机器学习的基本流程

整个风控建模流程,在个推大数据平台上完成。首先,对持续更新的海量一手数据进行收集、清洗、存储,在数据存储前进行ID打通;第二步,对清洗好的原数据进行特征构建;最后,利用多维度特征进行金融风控模型构建,用到的技术包括协同推荐算法、LR算法、XGBoost、营销模型、多头模型和信用分模型等。

建模流程

如何高效构建特征,是风控建模中一个至关重要的问题。在实践中,个推会对特征进行稳定性分析、脏数据/异常数据处理、特征分箱、特征聚合和特征有效性验证。特征评估指标则包括IV值、Gain值、单调性、稳定性和饱和度等。

风控场景机器学习的算法实践

利用上述多维度特征和建模能力,增能于贷前、贷中和贷后全流程:拉、选、评、管、催五大环节。

全流程数据增能

拉-营销模型,甄别虚假注册,评估借贷意愿

在拉新获客阶段,个推制定贴合大额、小额两种营销场景需求的营销模型,通过规则策略、模型策略、风控策略三管齐下,帮助客户识别“真人”,有效降低获客成本、提升注册率和转化率。客户可通过提供样本数据,通过个推来完成建模,同时,在缺乏样本数据的情况下,个推依托自身积累的海量样本数据,可以构建出多种营销场景下的通用模型,供客户使用。

选-贷前的审核,识别欺诈人群,防范恶意骗贷

贷前审核阶段我们通常采取两个策略:欺诈分模型、风险人群筛选。欺诈分模型指的是根据客户提供的数据信息在个推平台进行数据转换、特征匹配,并对其风险特征予以筛选,利用预设规则予以打分,最后得出相应的欺诈分。个推在逾350种特征中识别出数几十种风险特征。举例来说,当某用户安装小贷类APP达到多款以上,或线下到访场景异常,或该用户命中黑名单都会被识别为风险特征。根据欺诈分的高低予以排序,为客户列出不准入人员、需重点关注人员等。

风险人群筛选指的是根据用户存在的风险特征数量及程度,梳理出风险人员。个推利用筛选出的8种维度、350+特征,通过模型预测和规则制定,输出三类风险人群:黑名单、灰名单、多头名单。多头名单顾名思义,当某用户频繁安装或卸载多款借贷类APP时则会被模型系统判定为多头人员;灰名单指的是稳定性较差的人员,黑名单指的是异常人员。在贷前审核阶段,黑名单人员可直接不予以准入,灰名单和多头人员则需要重点关注。

评-信用分模型,贷前信用评估,辅助贷款定额

在评的阶段,个推采用信用分模型,为客户输出用户的信用评分。信用评分由五种维度构建而成:资产、身份、稳定性、关系、行为。个推信用评分模型先根据模型训练与规则模型,得到各个维度分,再将五个维度的个人评分作为特征输入模型,作为特征得到总体个人信用分。

信用分模型由多个模型整合而成,第一层是分类模型(lr+xgboost),得到分值;第二层在维度分的基础上再进行回归,得到最终信用评分。

管-贷中管控,监测异常特征,实现风险预警

在管的环节,个推采用贷中监测模型。从整体人群筛选出逾期相似(相关)人群,结合实时数据与高危特征异常监测得到高疑用户,结合客户的实际需求,对此类用户通过进一步的精准研判得到逾期风险人员,将此类人员告知客户,让其予以重点关注或排查。

催-贷后催管,催回价值评估,提高催回效率

在催的环节,个推基于自身构建的催回评分系统,可以有效指导金融机构制定差异化催管策略,助力更高效地完成催收工作。比如,当客户出现逾期和坏账时,金融机构通过个推的催回评分,对用户的还款能力和还款意愿进行评估,从而判断哪些用户优先催。

风控系统产品化

前面几个流程主要讲的是个推利用多维度特征自主构建风控模型,但在很多业务场景客户希望快速构建特征、快速返回风控结果。为此,我们研发上线个真决策引擎,在规则设计层为客户提供风控规则,让业务人员在规则执行层通过规则性加工进行灵活操作,目前已提供给部分客户试用。

风控决策引擎

如今,科技与金融深度交融的时代已经到来,金融风险控制任重而道远,。个推将持续挖掘其丰富的数据资产,不断打磨自身技术,助力金融行业运作效率和服务能力的全面提升。

(本文所有图片均来源于个推)

更多技术干货,请关注公众号:个推技术学院。

转载于:https://my.oschina.net/u/1782938/blog/3080282

【风控建模干货分享】个推大数据金融风控算法实践相关推荐

  1. 如何利用大数据做金融风控? 原创 2016年11月24日 17:42:03 标签: 大数据 / 金融 / 风控 1594 导语:如何通过海量数据与欺诈风险进行博弈? 随着金融科技、科技金融等概念的

    如何利用大数据做金融风控? 原创 2016年11月24日 17:42:03 标签: 大数据 / 金融 / 风控 1594 导语:如何通过海量数据与欺诈风险进行博弈? 随着金融科技.科技金融等概念的热起 ...

  2. 机器学习——2(大数据金融风控的预测案例学习总结)

    大数据金融风控的预测案例 1)数据准备 a)离群点处理 总体上先对数据进行了解,做一些简单统计,对连续性数值与字符型数值的处理: 离群点的处理: 首先,离群点的定义:是与其他大多数样本的行为或特征分布 ...

  3. 又有俩CEO被警方带走,还涉黑!这些“大数据金融风控公司”都怎么了?

    来源: 数据猿丨文:Toby 数据猿官网 | www.datayuan.cn 今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头条丨腾讯云·云+社区 ...

  4. 阿里专家分享:企业级大数据轻量云实践

    本文根据井诚老师于第九届中国数据库技术大会(DTCC 2018)的现场演讲<把大象装进冰箱 企业级大数据轻量云的实践>内容整理而成. 讲师介绍: 井诚,阿里巴巴技术专家,2004年毕业于哈 ...

  5. 抢滩大数据金融“蓝海”

    阿里巴巴.富士康.恒大--无论是传统领域.还是互联网领域,近年来各大企业纷纷涉足金融业.这印证了一句话--每一次人类社会的巨大进步,无不起步于科技创新,成就于金融创新.而继移动金融.互联网金融后,大数 ...

  6. 大疆无人机空三建模干货分享(大疆智图集群建模超详细教程)

    Part 01 大疆无人机空三建模干货分享(大疆智图集群建模超详细教程) 大疆智图集群简介 大疆在今年5月推出的智图3.0.0及以上版本中加入了集群功能,有集群版许可的用户可以使用此功能.智图集群是由 ...

  7. 【干货分享】大数据金融如何做到线上线下的融合?

    本讲座选自百融金服CEO张韶峰于2015年4月8日在青岛大数据高峰论坛金融大数据分论坛上所做的题为<线上线下融合的大数据金融建模>的演讲. 今天汇报的主要内容包括三个部分,第一个是传统风险 ...

  8. BDTC 2017 | “TOP10大数据应用最佳案例实践”十佳获奖单位精彩分享

    [CSDN现场报道]12月7-9日,由中国计算机学会主办,CCF 大数据专家委员会承办,中国科学院计算技术研究所.中科天玑数据科技股份有限公司.CSDN协办的2017中国大数据技术大会(BDTC 20 ...

  9. 大数据与机器学习算法相关的电子书分享

    大数据与机器学习算法相关的电子书分享 近日,偶然看到一个帖子,上面有一些常用的机器学习常用的电子书下载路径,遂复制到这里,分享给大家,希望可以有你需要的- @ 欢迎关注微信公众号:算法全栈之路心智探奇 ...

  10. 通过大数据智能风控,金融机构减少了对抵押物的依赖

    金融业的数字化转型引发持续关注.数字金融.智能金融.区块链等关键词都得到了热烈讨论.数据,作为一种新型生产要素,早已成为推动国经济质量发展的重要动能.数据智能驱动金融业蝶变,"一切业务数据化 ...

最新文章

  1. apache+tomcat 搭建负载均衡系统
  2. matlab imnoise 用法,怎样使在matlab用imnoise函数啊 对图像有什么要求才能用imnoise函数...
  3. Spring4+SpringMVC+MyBatis整合思路
  4. 抓个Firefox的小辫子,围观群众有:Chrome、Edge、IE8-11
  5. 第二章作业第2题--苏志华
  6. Kinect+OpenNI+OpenCV使用
  7. 集合的定义与并查操作(C语言)
  8. phpstudy编写html,phpStudy简介
  9. 电脑充不满电一直95_居民:小区充电桩为何充不满电?有关部门这样回应
  10. c语言例题 3/100
  11. 光立方体c语言程序,学C语言两个月做的一个旋转立方体!
  12. 解决Adobe Flash Player已不再受支持的问题
  13. centos7搭建hexo+nods.j个人博客
  14. ACM—数论—费马大定理 (数学史上著名的定理)
  15. http://jingyan.baidu.com/article/a3761b2b66fe141577f9aa51.html
  16. Java Spring MVC框架 VIII 之 Spring MVC拦截器
  17. java使用bks双向认证_GitHub - wanglijun93/RxHttpUtils: Rxjava+Retrofit封装,便捷使用
  18. 从easyui页面导出excel
  19. 外卖项目06---套餐管理业务开发(移动端的后台代码编辑开发)
  20. MySQL错误处理--1146错误

热门文章

  1. js笔记,自封装篇(二)之对象克隆
  2. Dex2Oat执行参数总结
  3. 附录一 常见概率分布及相关公式
  4. MSXML应用总结 开发篇(上)
  5. E-day0003:generate
  6. AD软件使用开发步骤思路与实践
  7. 电竞天才Uzi退役:从网瘾少年到年薪千万,留下最大遗憾
  8. 快速复制论文中的公式
  9. 人力资源管理数据分析
  10. 用Python3抓取并分析猫眼电影TOP100