关注 “番茄风控大数据”,获取更多数据分析与风控大数据的实用干货。

数据征信成本已经成为成为一家公司重大的费用支出,我们先看一份笔者之前从事过的一个现金贷的业务,也是在当时刚起步的项目,因为刚起步所以接入的数据源不多,那自然所用的费用也不多,也算是在该项目的所有的流程中最便宜的一次费用了:

从上面的数据,可以看出来,一个客户所有全查到数据的情况下,所花费的费用是九块五。九块五是什么概念,是非常便宜的数据费用。因为在正常的线上贷款公司而言,需要核查一家公司从线上到获客有效的整条产业链中,需要花费的费用大概就是20-50元的范围。

据笔者了解到,单单征信成本就占到整个金融公司的2%-5%的费用支出。征信成本太高,加上公司本来固定的运营成本、资金成本、人力成本各种乱七八糟的费用,一个产品的利息不达到24%以上,更有一些短期现金贷公司直到36%或以上,才能盈利,否则根本不赚钱了。

也基于这样的业务的逻辑催生出那么多的高利率的产品。征信成本太高了,也是目前整个行业的通病。

目前也因为征信成本过高,长期居高不下,每家公司在竞争角力上也一直在考虑如何优化相关的征信费用,毕竟利润已经有限,优化征信成本已经是必须要调整的内容。

想了解如何优化目前的数据源,进一步思考,追源溯本,就该深入了解目前所用能用的数据。只有对比完相关的数据源才能了解这些数据是否属于同质性的数据,源头的数据是否雷同或者相似,是否互相能取代,只有一个一个地了解熟悉,才能知道哪些可以交互和取代。

从今天开始的系列开始,我们将会对这些外部征信数据源,进行分析:

本系列的文章将分为几个部分为各位读者梳理目前市面上,常见的数据源,我们先从最常用的几个数据源开始梳理:

TongDun

TongDun的数据无疑是目前市面上最能查到最全面的数据源了,因为他们家做数据产品相对较早。所以数据覆盖率,在所有的数据厂家中最高的。但查得率是一回事,准确率是另外一回事。因为目前很多三方数据,其实都是无法考究真实性的。

央行征信数据,权威、真实、合规,这些都是三方数据都无法比拟的,难怪说实名上的数据之分两种,一种是央行征信数据,另一种就是第三方,无论第三方征信数据里的第三方有多大。

比如对于银行的大部分客群而言,银行间只查询银行间的数据,很少或者较少会查询非银机构的数据情况。因为非银机构的数据如何考究真伪就是个很重要的问题。但也不是每一家银行对待三方数据的角度都一样。从数据的参考来看,有些冒进些的银行会加大对第三方数据的使用,但也仅仅是对方必须也同样是持牌,受监管的单位。

相对地,非银机构也是类似。一位客户之前在小贷中申请过产品,在银行间的数据中是非常好的客户标签,但是等到去非银机构的时候,去发现该客户的借款行为已经是强苍百孔。

回到tongdun的征信数据本身,其征信接口是通过身份证和手机号码所对应的内容,便能反馈到具体用户的风险情况了,详情如下:

再介绍以上相关的数据维度的之前,我们先介绍一个权重分的概念。

权重分

目前世面上所涉及到规则的使用情况,对于某些规则比如命中多头或者黑名单类的强规则,我们一般不会一条规则名字就直接拒绝,一般会将每条规则赋予一个权重分。

同样的,如果权重分的累加大于某个值之后,才会真正去拒绝该客户,那权重分该怎么赋分?

如果一般有贷后数据的就参考贷后数据,这个之前在我们的文章有提及(传送门:重磅分享--基于违约概率跟odds的经验评分),而如果是新产品或者新的业务,没有具体的数据,就参考业内的方法,比如我们以身份证命中规则,整理汇总,情况如下:

身份证负面情况:

1.在强规则中第一梯队的规则,其权重占比也最高:

身份证格式校验错误

身份格式有误是在所有规则中权重排序最高的规则,因为格式有误证明该身份证持有人身份无法识别,证明该身份证信息连信息都无法查找,所以需要重新拒绝进件。

身份证命中欠款公司法人代表名单

欠款法人有重大负债,已经无法再继续经营项目,其他几条在这里的权重排位大致相同,就不明细

2.再继续分析第二梯队的身份证信息数据

存在欠费信息而且没有尝还,所以也跟第1级想类似,当然稍对比对应的权重仍弱于第一梯队的规则

3.第三梯队,涉及到较高风险,所以也是算较高风险的客群

4.较低风险的客群,对应如下:

这里的得分情况为稍微最低,因为最低的得分不太有相关的金融属性,所以所占权重比相对较低

在梳理相关的权重的时候,我们能按照这样的逻辑思路梳理:

身份证>手机号码>其他联系方式>联系人>测试数据

下面再展开的这些项,大概也是按照这样的方式进行梳理,请看——

二.我们继续分析手机号跟其他内容的信息如下,手机号负面:

三.座机/QQ号/邮箱负面

四.其他类负面

五.关联信息:

六.联系人近亲黑名单

七.联系人一般身份黑名单

八.其他类风险:

九.多次申请风险:

十.申请人关联信息过多:

十一.  测试类与预先埋伏类:

最后关于这份数据,会上传到知识星球上,请有需要的学习的同学自行下载这份最全面的数据,谢谢。

报名星球请添加小番微信,备注下行业+风控从业模块,谢谢您!

番茄学院管理员:小番
备注请填写行业岗位,谢谢啦!

外部数据源的使用汇总相关推荐

  1. 外部数据源的使用汇总二

            关注 "番茄风控大数据",获取更多数据分析与风控大数据的实用干货. 笔者总结了,目前市面上常用的数据源厂家,对相关的数据源进行了梳理,大概都能分成以下几类:公安信息 ...

  2. 风控外部数据源文章汇总

    1. 个人信贷 外部数据源:风控猎人 2. 小微 可用数据源信息:Fintech

  3. hive load data外部表报错_生产SparkSQL如何读写本地外部数据源及排错

    https://spark-packages.org/里有很多third-party数据源的package,spark把包加载进来就可以使用了 csv格式在spark2.0版本之后是内置的,2.0之前 ...

  4. 2021年大数据Spark(二十):Spark Core外部数据源引入

    目录 外部数据源 MySQL 数据源 演示代码 HBase 数据源 HBase Sink ​​​​​​​HBase Source 外部数据源 Spark可以从外部存储系统读取数据,比如RDBMs表中或 ...

  5. Spark SQL与外部数据源的操作(Spark SQL ——> CSV/JSON/Parquet/hive/mysql)

    目录 一.Spark SQL支持的外部数据源 二.Spark SQL -> CSV 2.1 读CSV文件 a.有列名 b.无列名 2.2 写CSV文件 三.Spark SQL -> JSO ...

  6. SparkSql读取外部数据源

    1.产生背景 用户需求:方便快速从不同的数据源(json.parquet.rdbms),经过混合处理(json join parquet),再将处理结果以特定的格式(son.Parquet)写回指定的 ...

  7. Spark SQL之External DataSource外部数据源(二)源代码分析

    上周Spark1.2刚公布,周末在家没事,把这个特性给了解一下,顺便分析下源代码,看一看这个特性是怎样设计及实现的. /** Spark SQL源代码分析系列文章*/ (Ps: External Da ...

  8. FTP使用外部数据源

    第一步安装FTP组件 这个就不说了 第二步安装开发工具组件 yum -y groupinstall "Development Tools" "Server Platfor ...

  9. InfoPath的常见问题---连接外部数据源提示

    1.安全性问题 使用InfoPath获取外部数据源时,会有一个这样的提示, 这时需要在安全中心里做一些设置 选择full trust就不会有上面的提示了 转载于:https://www.cnblogs ...

最新文章

  1. leangoo思维导图工具
  2. 使用树莓派和kali Linux打造便携式渗透套件
  3. django实现图片上传和显示
  4. s5pv210——I2C基础详解、I2C时序详解
  5. android 界面组件,安卓开发学习周第三篇——Android中的UI组件
  6. 【HDOJ】3459 Rubik 2×2×2
  7. python基础知识 ~ 异常处理与导入
  8. tp3.2 页面trace使用
  9. 每日一句20191019
  10. 关于学习Godot时遇到的问题(未解决)
  11. hdfs 指令_HDFS之一:hdfs命令行操作
  12. ST-link驱动下载、安装、配置和升级
  13. 2014广东计算机一级试题及答案,广东计算机一级试题2014版
  14. 一个虎扑社区数据分析实战
  15. C++批量修改文件后缀名(提供多种方法)
  16. java-常量和变量
  17. 自己动手写一个推荐系统,推荐系统小结,推荐系统:总体介绍、推荐算法、性能比较, 漫谈“推荐系统”, 浅谈矩阵分解在推荐系统中的应用...
  18. ASP.NET MVC 音乐商店完整项目示例
  19. matlab多元函数数值积分,(数值积分)多元函数的某一变量进行定积分,int积分不出...
  20. DiscoveryClient报错:

热门文章

  1. springboot获取项目路径_springboot学习
  2. ios kvo 要引入_iOS KVO 实现原理 和 自己实现KVO
  3. 三菱880彩铅和uni的区别_【彩铅基础】水溶性彩铅是什么?
  4. linux创建根目录代码,Linux文件系统之目录的建立
  5. java文件下载代码_Java代码实现文件下载
  6. CentOS 使用yum update 更新时保留特定版本的软件
  7. linux touch
  8. Rider找不到指定的 SDK Microsoft.NET.Sdk
  9. k8s nod rc service 使用
  10. 常用的MySQL命令大全