关注公众号“ 番茄风控大数据”,获取更多数据分析与风控大数据的实用干货。

  之前被一篇叫《你有什么资格嘲笑毛坦厂中学的学生》的文章刷屏,中国的阶级固化的趋势在可预见的未来会越来越严重,底层的人来苦苦挣扎,中产在整天焦虑,中国的太大,我们自以为的大学生是白菜价,现状在底层的考生那里还是难得一求的一张门票,无奈的现状除了每个阶层都付出非常大的努力外,还有其他办法能改变吗?大家感兴趣可以读读。

  记得我在做数据入门前,就有一个前辈跟我说,数据领域,特别是在我国的数据领域,很多数据你都只能智取,不能强夺,切记切记。那个时候,懵懂的我,还不知道这个是什么鬼理论。现在的我,经过多年的沉淀,慢慢地懂了里面的真谛,把所有做数据的人的苦逼简单粗暴的写一下吧。

  先贴点干货的图片,引出我需要阐述的主题。

  催收评分的变量整理是过程,是在业务定义后的第二个非常重要需要完成的部分,这个过程你大概是需要理清楚自己家究竟有什么数据,也就是需要知道自家的数据有哪些库存,前期先整理出一版合适的数据汇总结果:


  对于一些常见的指标比如PTP、KPTP这些,相信都是有的。但是这里重要但非常用的指标,在标准化的体系的数据库中有,但是不一定能获取到,即使获取到,你也需要再结合具体的业务做一次变量输出。

  我们在介绍过程中,先从简单到复杂,一层一层来剥离来看,会发现很多有意思的问题跟业务逻辑:

首先介绍客户档案里的数据:
房产情况—
  介绍房产情况这个变量,这个变量主要是甄别客户的固有资产情况的。你可能会说,这个变量有多复杂,不就是看客户名下有房没房就行了吗?没错,表面是这样,但是还不仅如此。如果还不明白,可能是你对整个数据层面里的业务逻辑还没吃透。

  试问:客户A名下虽无房,但是却有3套房贷记录?能不能算他有房?也许这种情况还算较易分析。有可能是A可能房产已经过户,只能算有过房产。

  但另一种情况:客户B名下无房,但是家庭名下有房,这种情况,能不能算有房的情况?如果再复杂点,客户已经离婚了,房产名下之前是双方共有,但是你在处理数据的时候,发现客户是离异状态,房产却在夫妻共同名下,此时你判断客户是有房还是没房?

  我记得当时单单在处理这个变量的时候,最后输出的规则一共是二十行代码去判断客户的房产状态。没错,实际的业务形态就是这样,然而比这复杂的更多的是系统层面的问题。

其次催收库里的数据:
1.contact的次数
  联系次数也算是比较有用的数据了。但是有些公司因为历史问题,一般也会在客户还款日到来之前给客户打温馨提醒电话,提醒还款。这时就会出现跟催收电话叠加的数据。

  试想没逾期的客户也同样地被催收系统拨叫,此时的数据在后台处理时候肯定会有所失真,而且最重要的两者如果没有做标识,根本就没法区分。

  现在知道,做的比较好,至少在后台是有标签可以区分这两类数据的。但是很遗憾,我还是看到很多公司是人工标识的还没做到自动化处理的程度。而且,有些像上面提到的打标签的事情也没做。

2.有效联系人的数量
  对于拨打处于M2的客户,越往上失联的客户的概率会越大,这个时候可能联系上客户的有效联系人的就只有亲戚或者朋友了。

  其实这时,在联系人上的做区分,如果能稍微精准写区分下客户本人,父母(直系亲属),兄弟(嫡系亲属),或者好友,策略或者模型的部门估计是无限欢迎的,但是对于这些精准区分的数据前期的业务整理当然是比较累。前期业务部门吐槽,做着做着,越来越没动力,数据就越做越变形了。到了最后,会发现,这个变量成为了无用的垃圾变量。自动化重复性的东西,最好还是交给机器去做。

  但是现阶段,有些公司是连是否客户本人或者非本人都没有区分的,都没做到。对于这样的数据区分度,有时候真的让人抓急。

3.合同的数量
  最后说下合同情况这个变量。合同情况,如果一些客户,只在我们公司贷过一次款的,那很好讲,合同情况只为1个。

  然而随着公司业务的扩张,对于前期优质的客户,常常会选择让客户尝试续贷或者再贷业务。如果客户同意,,这时合同的资料就会上传到另一个系统上去。新系统是为了续贷或者再贷业务开发的新产品。当这两个新旧系统接口没有打开的时候,会发现新旧系统完全是个割裂的板块,你要通过客户的身份证号码关联合同信息,对不起,臣妾做不到。再一次风控被IT击败。

  现实生活中,都是这样,我们想取的数,总是无法获取。我们总是想获取客户的收入能力,对于这样的指标,我们总是不停得去计算客户每个月的银行流水判断等等。

  最后提个问题:为什么在系统中,总有变量是业务需要,而无法获取的事情。其实最大的难点除了数据的获取外,必须从负责信贷的系统说起来。

信贷系统,主要分几大系统:
  核心系统:存储客户的账务信息,还款计划,还款流水等;完成客户开户、放款、冻结额度等操作。
  客户端系统:客户在使用终端的一些交互内容,与后台逻辑;将对应的数据存储。
  数据计算平台:满足风控实时审批过程中需要变量的实时计算,对接业务范围内审批需要的内部系统数据。
  征信平台:统一对接所有外部数据源,进行统一管理;满足审批过程中的灵活调用。
  审批系统:组织所有风控吸配合完成审批;告知核心客户与放款。
  资管系统;匹配开户资金方与放款时资金方的选择;P2P模式中单个资产的撮合。
  服务端系统:客户在终端上操作的行为与数据的留存;与风控系统交互。
  决策引擎:承接风控策略的部署;出具审批的决策建议。
  反欺诈系统:主要做关系网络的生成与衍生变量的计算;定义网络中节点的黑白。

  我改天会找个专门的专题,介绍信贷部门里的各个系统的模块。


  十年职场生涯,这个长期混迹在风控界和科技界,摸爬滚打的大叔,曾经就职于全国最大的固网运营商平台、国内最大的ERP软件公司和一家老牌的互金公司,如果你想了解他,欢迎加入" 番茄风控大数据"一起学习一起聊!

风控建模:催收评分卡(四)--变量整理除了跟数据获取相关外还跟什么有关系?相关推荐

  1. 风控建模(七):催收评分卡的流程—上(所有评分模型与机器学习模型同样适用)

    关注公众号" 番茄风控大数据",获取更多数据分析与风控大数据的实用干货.   说了那么久的建模,今天应该跟大家分享一下实际建模的流程步骤了.   整套建模代码我分别用sas跟pyt ...

  2. (信贷风控十)催收评分卡的介绍

    (十)催收评分卡的介绍 评分卡可分为申请评分卡(A卡).行为评分卡(B卡).催收评分卡(C卡).不同的卡使用场景不一样,A卡用于贷前申请环节,用来区分客户好坏:B卡用于贷中环节,根据观察行为预测未来一 ...

  3. (信贷风控十一)随机森林在催收评分卡还款率模型的应用(python代码实现)

    (十一)随机森林在催收评分卡还款率模型的应用(python代码实现) 催收评分卡和申请评分卡和行为评分卡不太一样,一般申请评分卡和行为评分卡使用一个模型就可以了,但是催收评分卡由三个模型构成:(不同的 ...

  4. 催收评分卡(一)催收评分卡介绍

      各位好!从今天开始本号会陆续公开催收评分卡的原创教程和资料,如果对这部分内容有兴趣,麻烦动动手关注转发,谢谢大家的捧场. 搜索关注公众号" 番茄风控大数据",获取更多风控干货. ...

  5. 【金融风控】信用评分卡模型

    本文转载自公众号:大数据风控与机器学习 一.简介 所谓信贷评分卡指的是,将违约概率映射成得分的模型.最传统.应用最广泛的算法是逻辑回归.但是理论上,所有能输出概率的模型均可以做为评分卡.比如这几年工业 ...

  6. 催收评分卡(五)--浅显理解模型一个非常重要的验证指标

    关注公众号" 番茄风控大数据",获取更多数据分析与风控大数据的实用干货.   之前说的关于变量的整理,按照一套标准化的建模流程,变量整理完后,一般会基于各种基础变量做数据衍生.   ...

  7. 催收评分卡(三)迁徙率模型

    关注公众号" 番茄风控大数据",获取更多数据分析与风控大数据的实用干货.   本文主要介绍迁徙率模型和还款率模型,至于失联模型,其实也不难做,难点是在于每家公司对失联客户的定义,主 ...

  8. 金融风控实战——信贷评分卡

    信贷评分卡介绍 风控系统业务流程   在一个完整的风控系统中,信贷准入模型在整个体系的前半部分,下面我们了解一下一个完整的风控系统是如何构建的 获客阶段   基本的,对于一个信贷产品来说,首先要有目标 ...

  9. 金融风控-- >申请评分卡模型-- >申请评分卡介绍

    从这篇博文开始,我将总结金融风控中的另外一个模型:申请评分卡模型.这篇博文将主要来介绍申请评分卡的一些基本概念. 本篇博文将以以下四个主题来进行介绍说明: 信用风险和评分卡模型的基本概念 申请评分卡在 ...

最新文章

  1. Python 标准库之 datetime
  2. mn之间的回文数c语言,c语言描述回文数的三种算法
  3. 数据库技巧——MySQL十大优化技巧
  4. PIL图像处理:读取图像,显示图像,ROI,保存图像
  5. 野火STM32F103教学视频完整目录(配合霸道-指南者开发板)
  6. win7下安装redies
  7. 【java开发系列】—— spring简单入门示例
  8. Mysql数据类型之字符串的案例介绍(含latin1下varchar的最大长度是65532还是65533)
  9. Apollo 刨析:简介
  10. python panda apply_python – Pandas – 关于apply函数缓慢的解释
  11. 微信开发系列之六 - 使用微信OAuth2 API读取微信用户信息,显示在SAP UI5里
  12. python 1秒启动一个下载服务器
  13. 深度学习优化算法大全系列5:AdaDelta,RMSProp
  14. 萤火虫算法matlab实现,萤火虫算法,matlab代码.doc
  15. 怎么完全卸载赛门铁克_symantec卸载方法
  16. 合并Python列表的魔幻12法
  17. 简述FPGA的一些优势
  18. 关机提示 ”task host window任务宿主正在执行关闭任务并且正在停止已运行的任务“我是这样解决的
  19. 咸鱼半学期总结+老年人康复训练
  20. Prometheus监控服务器

热门文章

  1. 大数据中心周边辐射大吗_“一部手机读云南”上线 力争建成国家方志大数据中心西南中心...
  2. python杀线程_python-有什么办法可以杀死线程吗?
  3. matlab硬币覆盖问题和八皇后,八皇后问题matlab程序
  4. Python来处理数独游戏(含世界最难数独示例)
  5. 高级排序之分割法(以某数为基准分割)
  6. 二级c语言考试改卷标准,计算机二级C语言笔试试卷
  7. 记录开发移动端项目过程中的各种问题、插件及教程(不定时更新)
  8. 在 Linux 下使用 RAID(九):如何使用 ‘Mdadm’ 工具管理软件 RAID
  9. php 生日提醒程序
  10. jQuery Mobile 学习资料