外部数据源的使用汇总二
关注 “番茄风控大数据”,获取更多数据分析与风控大数据的实用干货。
笔者总结了,目前市面上常用的数据源厂家,对相关的数据源进行了梳理,大概都能分成以下几类:公安信息、运营商与号码识别类、银联信息、爬虫信息、学历与职业技能信息、航旅查询、资产查询。
对于以上分类,我们单独挑几个数据维度解释下,其中:
公安信息
身份证二要素:身份证号+姓名——从身份证和姓名的信息,返回个人的信息匹配情况,是否存在该身份证信息
照片比对:OC认证,虚假身份证等伪冒风险的克星
人脸对比:测进件的是不是一个真实的人(关于这点可以参阅,之前我们公众号的文章:揭秘OCR的策略规则)
公安黑名单(不良犯罪记录):在第一条的基础上,是否还能检测到该身份证有名字公安库中的不良犯罪记录等,目前有个别厂家能支持这样的信息查询
多头数据信息
多头的情况,即在多家非银机构中申请的贷款的情况,按照多头的时间维度可以细分为:近7天;近15天;近1个月-最近30天;近3个月-最近90天;近6个月-最近180天;最近最早申请记录
关于多头,之前介绍过很多,在这里就不细讲。但对于多头资深业内同仁表示,多头其实没有太强的矫正机制,对于许多上报的信息都无法核实真伪,所以这也给竞争激烈的金融市场一些不良公司有机可趁,虚报、多报的信息已经屡见不鲜,所以各位在使用多头的信息,需要谨慎,多头主要分为:
多头申请、多头拒贷、多头放款、多头逾期、信用状态/负债报告等产品
资产查询
资产情况是评价具体客户是否拥有还款能力重要的指标,主要的维度就是核查房产、车产的状况,并且在 里面也能细分许多不错的衍生变量,具体的细则有:
房屋价格查询/评估、车辆资产核验、行驶证信息查询、车辆出险和保养查询、车辆违章
BiRong
本周已经跟大家分享了Tongun的数据源情况,今天再次分享BiRong的数据源情况,主要介绍目前常用的模块,也是甲方常用到的三个模块:
特殊名单、多头、评分
一.BiRong特殊名单
关于特殊名单,BiRong对具体名单分为以下几类,并且进行了具体的定义:
资信不佳:提供的申请资料未达到准入标准、信息被伪冒
法院被执行人:被执行人是指在法定的上诉期满后,或终审判决作出后,拒不履行法院判决或仲裁裁决的当事人
法院失信被执行人:具有履行能力而不履行生效法律文书确定的义务,但是故意抗拒执行义务的被执行人
目前在数据源上的使用方法上,一般都是弱授权的方式;也即,我们给予数据厂家对应的二要素、三要素、四要素,他们返回具体的查询结果。
所以BiRong也不例外,采用的接入的内容为:身份证号,手机号,姓名,联系人手机号等。
在梳理BiRong的数据源内容时候,对特殊名单的分类,BiRong还会将查询机构的类型,分成银行机构跟非银机构两类信息,P2P、 小贷、消费类分期、现金类分期、代偿类分期、其他
支持身份证号接入查询的信息情况:
支持手机号码接入查询的信息情况:
在以上的产品中,我们都能看到一个高危行为的定义,所谓高危行为一般为:申请信息中身份证号关联多个(>3个)手机号、或手机号关联多个(>3个)身份证号。
并且在BiRong的数据中,还有一个跟查询用户一度关系、二度关系的数据查询情况,
一度关系:百融关系库中与本人有直接关联的人,一般是直系亲属、关系紧密的朋友
二度关系:百融关系库中与一度关系有直接关系的人
一般关于这个关系库,我们也常使用以下规则:联系人的先都不拒,低风险的放开,高风险的拒绝
二.BiRong多头
按照BiRong的逻辑,在多头查询上,也同样按照查询机构的类型,分成银行机构跟非银机构两类信息,P2P、 小贷、消费类分期、现金类分期、代偿类分期、其他。
并且按照具体的时间切片按照:近7天;近15天;近1个月-最近30天;近3个月-最近90天;近6个月-最近180天这些时间维度划分,具体的数据查询内容如下:
三.BiRong评分
最后介绍BiRong评分,也是经常使用的一个变量,而且在不少的评分模型中,也是经常入模的一个变量。
在风控的使用过程中,评分取值范围[300,1000]分数越高,客户信用越好。并且BiRong评分三类:通用评分,客群评分,客制化评分。
入参:身份证号,手机号,姓名
出参:也即输出结果中,主要会调出:score/1(输出成功)/0(未匹配上无输出)/(用户输入信息不足)/(系统异常)
笔者对曾经的测试结果样本做了一个提测,具体的数据结果如下,跟普通的评分卡类似,同样会划分为拒绝、通过、人工审核三块
当然既然是评分,还必须配套相关的模型的验证的指标等,我们会使用ks值去,观察数据源的评分的区分程度:
一条KS值曲线,也必须画上,帮助我们理解,具体KS的公式在这里不详细介绍,如有不懂可以跟我们交流:
最后关于这份数据,会上传到知识星球上,请有需要的学习的同学自行下载这份最全面的数据,谢谢。
我们的课程已经上架了配套的视频教程并且关于之前文章里提到的代码和数据,如果有兴趣学习的同学,也可以加一下官微了解下。谢谢!
报名星球请添加小番微信,备注下行业+风控从业模块,谢谢您!
番茄学院管理员:小番
备注请填写行业岗位,谢谢啦!
外部数据源的使用汇总二相关推荐
- 外部数据源的使用汇总
关注 "番茄风控大数据",获取更多数据分析与风控大数据的实用干货. 数据征信成本已经成为成为一家公司重大的费用支出,我们先看一份笔者之前从事过的一个现金贷的业务,也是在当 ...
- 2021年大数据Spark(二十):Spark Core外部数据源引入
目录 外部数据源 MySQL 数据源 演示代码 HBase 数据源 HBase Sink HBase Source 外部数据源 Spark可以从外部存储系统读取数据,比如RDBMs表中或 ...
- Spark SQL之External DataSource外部数据源(二)源代码分析
上周Spark1.2刚公布,周末在家没事,把这个特性给了解一下,顺便分析下源代码,看一看这个特性是怎样设计及实现的. /** Spark SQL源代码分析系列文章*/ (Ps: External Da ...
- 风控外部数据源文章汇总
1. 个人信贷 外部数据源:风控猎人 2. 小微 可用数据源信息:Fintech
- hive load data外部表报错_生产SparkSQL如何读写本地外部数据源及排错
https://spark-packages.org/里有很多third-party数据源的package,spark把包加载进来就可以使用了 csv格式在spark2.0版本之后是内置的,2.0之前 ...
- Java面试笔试题大汇总二(最全+详细答案)
本篇文章内容过多,只能分成两部分: 汇总一:https://blog.csdn.net/qq_20757489/article/details/93714854 汇总二:https://blog.cs ...
- Spark SQL与外部数据源的操作(Spark SQL ——> CSV/JSON/Parquet/hive/mysql)
目录 一.Spark SQL支持的外部数据源 二.Spark SQL -> CSV 2.1 读CSV文件 a.有列名 b.无列名 2.2 写CSV文件 三.Spark SQL -> JSO ...
- 外部数据源 之 Plugin 可插拔的方式整合到Spark中/Spark源码中
一:概念理解 Plugin 可插拔的方式整合到Spark中/Spark源码中 为了在用外部数据源读取文件的时候,本来读取是valui 使他变成一个带schema的df 有具体的信息 外部数据源就是把很 ...
- Spark SQL External DataSource外部数据源操作流程
一:获取文件 官网:https://spark.apache.org/docs/latest/sql-data-sources-load-save-functions.html spark本身 有测试 ...
最新文章
- 2.使用windows下的client连接虚拟机上的oracle连不上的时候的解决方式
- 算法分析与设计-实验四 回溯算法设计
- C++ 生成洛伦兹的蝴蝶
- 陌陌怎么发起群活动 陌陌群组发起群活动教程
- PYTHON-anaconda-安装
- 2.5. SciTE
- PHP底层的运行机制与原理
- java聊天室项目_JAVA聊天室项目展示.ppt
- IGBTMOS管的工作原理及检测方法
- WPS js宏 md5
- 概要设计模板 外部接口设计_0226 rest接口设计
- flink实战-实时计算平台通过api停止流任务
- originPro2021(7)导出图表不清晰
- MSCNN论文解读-A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- ESP32 天气预报 彩屏
- Excel的Sumif函数
- Tiled结合Unity做地图——Tiled2Unity
- 树莓派4无痛安装OpenCV+python3
- 基于VuePress搭建网站
- Gson解析异常com.google.gson.JsonSyntaxException: java.lang.IllegalStateException: Expected BEGIN解决方案
热门文章
- qtabbar设置不同宽度_透水地坪需要设置伸缩缝吗?
- lazarus控件怎么那么少_盘点5个常被搞混的控件与规范
- 5ecsgo启动失败2错误代码2_Xcode 10.2 编译失败,如何对敌?
- python椭圆曲线加密_如何理解椭圆曲线加密并对其进行编码
- php日志缓存,php – Symfony和Docker – 缓存和日志目录权...
- IIS6.0目录解析漏洞原理/复现
- 关于UploadValues ,太可恶了
- linux下提示libpng12-0缺失
- 9.23 基础知识
- Bootstrap3.0入门学习系列规划[持续更新]