风控场景下的数据源主要可以分为两类。 一类是银行和互联网金融机构通过自身业务线产生的金融数据, 包括征信报告、 交易流水、理财产品等, 这些强金融属性数据由于直接与客户的金融行为挂钩, 因而能够比较好地刻画客户的风险状况。另一类是非金融机构产生的数据, 例如运营商、 地理位置、设备属性等,这些弱金融属性数据虽然不能直接反映客户的风险, 但是通过特征和模型方式上的加工, 能 够对强金融属性数据起到较好的补充和增益作用, 因此也被纳入风控大数据体系内。

1、征信报告

介绍风控大数据, 首先就要从央行征信报告说起。征信报告来自中国人民银行征信中心, 是由国家设立的金融信用信息基础数据库,由国内各类放贷机构定期上报后经征信中心统一汇总而成。

2、消费能力

消费数据主要来自银行卡的交易流水和部分互联网巨头所掌握的特定场景下的消费流水, 例如电商、出行等。 消费数据主要包括客户的消费金额、消费频率、消费偏好、消费时段、消费排名、消费稳定性等,能够衡量客户的消费能力, 从而计算客户的风险状况和收入情况。 对于掌握了一些特定场景的互联网巨头, 消费数据可以帮助筛选出一批体系内的活跃用户, 用来开白或者增信,保证业务开展前期风险在可控范围内。

3、资产状况

资产状况可以分为固定资产和流动资产。

4、基本信息

基本信息也是风控场景中应用较为广泛的一类数据源, 不仅可以用在准入阶段制定年龄和地区的白名单,也可以作为风控模型的人模特征。

5、黑名单

市面上的黑名单数据来源较为广泛,定义也各不相间,这里分情况来介绍。首先是公安部门的黑名单和最高法院的失信被执行人,这类数据命中率不会太高,但是被命中人群都是有过案底或重大违约记录的,应当配置策略直接拦截。其次是互联网巨头,包括阿里、腾讯、 京东等,对外输出基于体系内数据和坏样本的黑名单评分模型。最后还有一类黑名单,是金融机构在业务开展过程中自行积累的内部黑名单库,包括欺诈名单、严重逾期名单、 欺诈设备ID等,这部分黑名单数据更加贴合机构自身的业务和数据特性,并且生成逻辑透明,可以通过案件调查的方式深挖背后隐藏的规律。

6、多头借贷

多头是指客户在多家借款机构发生注册、 申请、 贷款、 逾期等行为,是信贷风控场景中一类具有特色并且非常重要的数据源。 对于存在多头行为的借款人,通常代表该客户在近期内资金状况较差, 在多个平台上寻求贷款并且身背大量共债, 暗含着较高的信用风险和欺诈风险, 是金融机构需要重点识别和筛选的客群。

7、运营商

运营商数据主要通过与三大运营商直接或者间接合作获得, 目前整体接入价格较高, 机构会优先选择几个验真类服务接入, 通过输入手机号码,运营商返回是否真实、 是否小号、 是否疑似养卡等字段, 帮助机构进行反欺诈验证工作。除去验真类数据, 在网时长和在网状态这两个特征, 由于覆盖三网并且接入渠道较多,也经常被用于风控策略和模型中。

8、地理位置

由于业务需要, 各类互联网金融App都会或多或少地采集借款人的地理位置信息用于风控建模。

9、设备属性

目前大多数信贷业务均发生在移动端, 因而借款人在贷款申请时所使用的移动设备也能够很好地被用来进行风险识别。 设备属性包括设备ID、设备型号、手机品牌、操作系统、版本型号、连接WiFi的MAC地址等。

10、操作行为

对于隐蔽性较强的欺诈风险, 操作行为数据是目前应用较多并且效果比较好的 一类数据源。 通过分析借款人的操作习惯、页面停留时长、人脸失败次数等特征,风控人员可以量化每笔操作涉及第一方欺诈或者第三方欺诈的可能性,进而实时提醒或者拦截, 预防欺诈案件的发生。 不过操作行为数据虽然效果明显, 但是由于是线上实时采集和计算的, 难免存在线上数据丢失、计算延迟、线上线下模型特征差异等问题,需要风控人员在离线建模阶段进行更细致的分析, 并且做好线上实时监控的工作。

备注:部分内容来源于网络,侵删

智能风控模型之数据源类型相关推荐

  1. 如何用AI算法识别骗保行为?蚂蚁保险智能风控模型首次公开!

    阿里妹导读:人生充满意外和不确定性,保险的使命,就是给人以安全感.风控是保险业务正常发展的重要环节,成长于互联网环境下的保险风控更为重要. 今天,阿里工程师正在利用跨平台体系下的海量数据资源和智能风控 ...

  2. 【新书速递】评分卡建模红宝书,夯实智能风控底座

    近些年来,智能风控技术在金融风险管理中的应用越来越广泛.智能风控利用金融大数据.机器学习.深度学习.强化学习.时序数据分析.异常检测.社交网络分析.图深度学习.知识图谱.自然语言处理.文本挖掘等智能分 ...

  3. 风控的进化——从传统风控到智能风控

    对于金融企业来说,风控模型和风控体系需要非常有经验的金融从业人士进行把控.比如,银行风控模型的出发点主要是衡量借款方的还款能力,一般来讲,模型包含了两部分的评判,即客观性的和主观性的.客观性的评判主要 ...

  4. 风控策略和模型的区别_智能风控平台核心之风控决策引擎(二)

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 互金杂货铺(id:hjzahuopu) 作者 | 互金杂货铺 本文摘要:信贷风控策略建设思路 ...

  5. Nebula 在 Akulaku 智能风控的实践:图模型的训练与部署

    本文整理自 Akulaku 反欺诈团队在 nMeetup·深圳场的演讲,B站视频见:https://www.bilibili.com/video/BV1nQ4y1B7Qd 这次主要来介绍下 Nebul ...

  6. 《如何搭建小微企业风控模型》第四节 了解数据源

    <如何搭建小微企业风控模型>第四节 了解数据源 第一章 小微企业数据风控技术的框架 小微企业数据贷发展情况概述 搭建小微企业风控模型所需知识 风控模型概览 第二章 强相关变量:企业经营数据 ...

  7. python智能决策系统_智能风控决策引擎系统可落地实现方案(三)模型引擎实现...

    I.风控模型介绍 在之前的文章中,我们实现了规则引擎和决策流,基本完成了风控决策引擎系统的雏形.相关文章请看: 大数据风控领域通常根据规则对风险用户进行有效识别并拒绝准入或提高准入门槛,如判断用户信用 ...

  8. 王欢:如何构建好的智能风控工具体系?

    本文约4600字,建议阅读9分钟本文将介绍在风控实践中积累起来的一些标准化的工作,包括遇到的问题和采取的解决方案,以期构建一个好的智能风控工具体系. 本文由融360高级数据算法工程师王欢老师带来&qu ...

  9. 网际风全推数据接口_智能风控系统设计与实践

    导读 在主流互联网产品中,比如搜索和推荐的系统,为了挖掘用户潜在购买需求,缩短用户到商品或信息的距离,提高用户的使用体验,都需要使用大量的特征来刻画用户的行为.在信息安全领域,建立在人工智能技术之上的 ...

  10. 智能风控中台设计与落地

    导读:风控是金融最常见的场景之一,本文将从业务和技术架构两个层面和大家探讨如何落地智能风控中台系统. 分享主要围绕下面五点展开: 风控中台的设计背景 策略的全周期管理 模型的全周期管理 业务架构和能力 ...

最新文章

  1. html盒子宽高,css盒子模型之宽度和高度
  2. 影像组学视频学习笔记(42)-影像组学特征提取问题解决过程复现、Li‘s have a solution and plan.
  3. JBoss 类加载器问题解决
  4. CaaS环境下实践经验总结(二):监控系统部署
  5. 用神经网络二分类人脑与电脑
  6. IBM® Bluemix 上运行ASP.NET Core
  7. Java集合(六):专用集合和遗留类
  8. Socket、Http、TCP/IP、UDP的联系与区别
  9. ARM平板电脑移植Linux,iperf ARM移植
  10. 服务应用监控健康检测
  11. [控件] 将字符串转换成贝塞尔曲线并执行动画
  12. Unity在运行时使用FBX SDK的API
  13. 关于write和read以及文件读写位置
  14. Android 清理后台进程
  15. 用计算机语言说一局情话,计算机中的情话
  16. LVM动态添加硬盘空间
  17. splice和sendfile
  18. AMD将推出7纳米GPU Vega,专为深度学习和机器学习打造
  19. css3,background-clip/background-origin的使用场景,通俗讲解
  20. CSS 外边距重叠及防止方法

热门文章

  1. python有趣的例子和故事_Python几个有趣和特别的小故事
  2. (转)Spring事务异常回滚机制(出处在文末,转自李慕白大神)
  3. vue中使用leaflet加载open street map的一些使用
  4. Android仿微信视频聊天窗口,Android仿微信语音聊天界面设计
  5. 蘑菇街2016校园招聘——聊天
  6. L2到L4的泊车辅助系统---APA自动泊车、RPA远程遥控泊车、自学习泊车、AVP自动代客泊车
  7. pythonturtle魔法阵_开启NLP的大魔法阵——一步一步教上手Bert的Fine Tuning
  8. vue音乐卡住_大神教你解决vue怎么添加音乐【突破措施】
  9. 牛客IOI周赛17-普及组 数列统计(组合数)
  10. 计算机的桌面偏上怎么调整,电脑桌面软件太靠边怎么办