征信行业历史起源

征信机构始于19世纪30年代的美国。雏形是一些商业调研机构,服务民间或银行借贷业务,获取信息途径通过招募些调研人员去街巷走访,然后逐渐形成规模及规范化。

作为起源之地,美国有3大征信机构都有百年历史,例如全国性3大个人征信机构益博睿、艾荃法克斯、环联。3大征信机构数据源95%相同、覆盖90%美国人。可以看出美国的征信数据覆盖率是非常广的。其征信服务覆盖行业也非常多。在美国个人征信收到严格的监管,监管法律也非常健全,目前企业征信基本不受监管。

中国征信行业历史起源

在中国,最早的专职征信机构是中华征信所,于1932年6月6日创办。国内征信行业快速发展基本是2003年后开始。在这一年中国人民银行征信管理局也成立了。2017年6月个人信息安全法出台,整个征信行业对数据的敏感性输出做了很大调整,很多敏感信息接口都主动关停。

中国央行征信覆盖情况

国内,央行征信数据其实只覆盖了3.8亿左右的自然人,覆盖率非常低,还有几亿人只有简单的身份数据。美国已达90%以上,因此在国内单靠央行数据已经不太符合创新型的互金行业信贷产品。从而催生了各式各样的数据公司(包括备案的征信机构)尝试将非央行征信的电商、社交等数据应用于信贷风控,例如京东白条。

中国个人征信行业查询规模情况

无论国外还是国内,企业征信的发展都不如个人征信。从国内央行征信查询数据来看,2015年已达6.3亿,这还只是央行体系内的数据查询量,可见征信行业市场可见还是非常巨大。以此类推,央行外的类征信数据市场规模应该也是非常客观。

中国个人征信行业备案情况

在国内还没有一家征信机构获得正式牌照。之前沸沸扬扬的8大征信机构也只是属于备案阶段。国内2016年底备案有134家机构,最新公布的数据其实只有133家征信机构还在备案,经过全面的初步调研,仅有20%不到的征信机构是属于有业务开展,其他的大多还在筹备和摸索阶段。这些备案机构属于正规军,市场上还有很多数据科技公司也在做征信业务,但为了避开监管,多打着“信贷风控”等名号开展数据查询的交易业务。而这些非正规军却非常有活力,各种创新的信贷模型产品层出不穷,具体哪些真的好用,还无法判断。

后续将征信备案机构及非备案机构归类为“大数据行业”机构

中国征信行业数据主要类型

征信行业使用的数据主要包括传统央行的征信数据及互联网征信数据。

互联网征信包含的数据主要涉及传统央行的征信数据、经营数据,身份数据、社交数据、消费/财务数据、乃至日常活动数据、特定场景下的行为数据等。严格来说互联网征信数据大多数与个人信用是弱相关的,因此才有N中关系型算法来验证各种数据相关性来判断个人信用可靠性。

传统征信体系的征信(央行)由于体制和技术等原因使用多限于金融行业,而互联网金融平台的大数据征信结果往往有在金融业外的更多应用。

中国互联网征信行业数据类型

互联网征信数据使用的比较多的主要有个人身份信息(个人基本信息、教育学历信息、驾驶证信息)、个人消费相关数据(资产信息、兴趣爱好、电商注册行为),银行持卡人数据(POS交易信息、个人借贷卡账单信息、线上线下支付数据),互联网用户及行为信息(APP浏览数据、WEB浏览数据、地理位置信息),司法被执行信息(裁判文书信息、履约被执行信息、失信行为信息)、借贷黑名单高风险客户名单(传统金融、互联网金融)、航旅信息(出行频率、票务信息)、位置信息(实时位置、常用地址、出行轨迹)等。 但掌握这些信息的企业基本属于行业内的巨头,例如3大运营商、京东、淘宝等。

大数据的风控框架

基于国内的征信行业大调研,基于大数据的风控框架大致是这样。一些枝节部分其实对应了贷前中后使用到的一些大数据及大数据的来源。其中对应不同环节使用的技术能力和数据源要求都不一样。在P2P等高风险行业,使用多头数据来做阻断或获客都可以。数据的使用不是一成不变,均要看行业、产品、风险定价等灵活使用。在支付环节,结合位置信息就成了反盗刷的功能。这里不一一举例。

大数据风控行业类型

围绕大数据框架的整体思路发展,大数据风控行业其实简单来分有3种:个人/企业数据接口批发、个人/企业数据接口整合报告、个人/企业数据建模及分析系统。图上均是行业内比较知名的一些机构。产品输出方式:各类接口直接联调调用、网页版登录查询及管理、定制化风控报告、联合建模。

个人征信模型通用简版思路

最后说下非全自动的个人征信模型简版思路:首先需要接入各种各样的数据源,这些数据源需要与业务需求符合,其次将各类裸数据拆分,根据业务类型及其他规则进行特征提取,初步分类。然后,各类特征将根据不同算法逐一组合成对应模型,应用与不同业务场景。不同模型经过机器学习(监督学习及无监督学习)的方式,输出相应分值,给与各模型相应的参考。最好还需要有经验人士,根据得分进行最后的决策。

补充

  1. 银行机构等大型企业的信贷产品多以央行征信数据为主,非央行的大数据为辅。而消费金融及P2P等机构,因为面对的客户群、产品及风险等原因,多以非央行大数据为主,基本不使用央行数据。
  2. 国内征信行业合作伙伴默认征信系统有2套:央行征信系统和民间借贷征信系统。正常情况,银行基本都接入了央行征信,因此银行类客户对自身信用记录非常在意。但互金行业基本没进央行征信系统,而是联合成立了民间征信平台。在民间借贷征信系统里,其实也会影响其借贷行为。特别是现在银行的信贷产品及信用卡都开始使用多头借贷这些数据辅助
  3. 很多小贷公司却只给多头借贷名单上有还款能力的客户借款

End.

转载请注明来自36大数据(36dsj.com):36大数据 » 从事大数据征信行业,你必须知道这些

从事大数据征信行业,你必须知道这些相关推荐

  1. “三驾马车”拉动大数据征信 行业格局突变

    2016年,科技领域里的谷歌机器人4:1战胜李世石,商业领域里阿里巴巴超越沃尔玛,可以算是人类历史上划时代的两件大事.大数据.云计算正推动互联网与传统行业的结合向纵深发展. 所有互联网影响比较大的行业 ...

  2. 大数据征信进入洗牌期,区块链或成新一代征信系统底层架构

    由于中国的消费金融需求旺盛但服务相对落后的行业特点,导致行业内数据滥用现象严重. 此前,人民银行征信中心副主任汪路在公开场合表示,在当前征信体系已经严重滞后于经济.金融发展需求的情况下,这些弊端应当受 ...

  3. 【2017年第1期】我国大数据征信的挑战及对策

    李友元1,寇纲 2  1. 西南财经大学金融创新期刊,四川  成都  611130: 2. 西南财经大学大数据研究中心,四川  成都  611130 摘要:大数据征信能够满足缺乏或没有信贷记录人群的金 ...

  4. 大数据征信与个人隐私保护

    大数据征信是指运用大数据技术构建征信模型及算法,通过对海量数据进行采集.分析.整合和挖掘,多维度刻画信用主体的违约率和信用状况,形成对信用主体的信用评价.大数据征信的核心是将大数据技术应用到征信活动中 ...

  5. 从大数据征信看银行风控创新

    数据将是未来银行的核心竞争力之一,这已成为银行业界的共识.在大数据时代,银行所面临的竞争不仅仅来自于同行业内部,外部的挑战也日益严峻,互联网.电子商务等新兴企业在产品创新能力.市场敏感度和大数据处理经 ...

  6. 大数据征信面临的挑战与对策

    随着征信市场化步伐加快,大数据征信成为热门话题,受到互联网金融和资本市场的追捧.征信与大数据有着基因层面的密切关系,一方面,征信数据是天然的大数据,理论上与消费者和企业相关的数据都可以用来作征信:另一 ...

  7. 侵犯公民个人信息: “两高”首次出台司法解释 打击大数据征信乱象

    [ 5月9日,最高人民法院.最高人民检察院首次就打击侵犯个人信息犯罪出台司法解释,将在一定程度上影响大数据.个人征信企业 ] 5月9日,最高人民法院.最高人民检察院首次就打击侵犯个人信息犯罪出台< ...

  8. 中国移动联招商局进军大数据征信

    中国移动在泛金融领域的跨界还在继续. 在出资20亿元和一众合作伙伴发起成立仁和保险(包括财险与寿险)之后,中国移动又联手招商局设立了试金石信用服务有限公司,新公司注册资本3个亿,注册地为深圳前海. 根 ...

  9. P2P行业大数据征信前瞻

    9月23日,由上海市经信委.上海市金融办指导,上海市信息服务行业协会牵头编纂的<2014上海网络信贷服务业白皮书>发布.白皮书显示,目前央行征信中心针对拥有信用记录公民收集的信息共包含两类 ...

最新文章

  1. 动态绑定与继承:不得不去想细节
  2. 全世界都认为汉语是婴儿语(转载)
  3. Floats and marginpars not allowed inside `multicols' Unknown float option `H'. 基于LaTex+VSCode+MAC
  4. Flask == scoped_session
  5. 【JAVA】StringTokenizer 迭代方式对字符串进行分割
  6. AI「抄」代码无罪?GitHub Copilot拿用户的开源代码改一改就去挣钱!
  7. 如何实现一次编码,到处运行?新一代云端一体化探索
  8. Java工作笔记-IntelliJ IDEA中的精确搜索
  9. 阿里中台建设全解密:包含哪些内容?如何发挥作用?
  10. 一起谈.NET技术,ASP.NET2.0服务器控件之类型转换器
  11. Spark SQL将rdd转换为数据集-反射来推断Inferring the Schema Using Reflection
  12. iOS9.3.3骚扰电话拦截黑名单数据库
  13. 对计算机相关领域及前沿技术的认识,计算机专业教育及新技术讲座(对计算机专业的认识)论文.pdf...
  14. HTML学习笔记(2)
  15. 电脑怎么设置定时关机?
  16. 硬链接和符号链接详解
  17. 视频编码中CBR和VBR的区别
  18. warning no match for this type name:xxx.xxx.xxx [Xlint:invalidAbsoluteTypeName]
  19. c语言位运算负数的实例_巧妙运用C语言位运算
  20. Qmail+Vpopmail 安装相关文档

热门文章

  1. 东北大学c语言作业 函数,东北大学C语言程序作业
  2. 熔断器 java_防雪崩利器:熔断器 Hystrix 的原理与使用
  3. 如何用pdf转jpg软件将pdf转换成图片
  4. 2.2_枚举类型的特点
  5. 简谈FPGA的上电复位
  6. 【Python】元组的应用场景和定义元组
  7. Python——元组_元组的基本操作_元组与列表相互转换
  8. 200所高校男女比例排行榜,脱单还有望吗?
  9. 推荐一款手机Python编程软件
  10. 苹果电脑错误代码43_苹果最臭名昭著的代码错误