建模准备这里我想跟大家分享五个点,就是在建模准备中需要做的五个方面。

一、业务目的

模型都是建立在业务目的上的,我们要根据不同的业务目的建立不同的模型,那么业务目的会从以下三个方面出发:

1、客户。客户可以分为:有钱还的,没钱还但是心里想还的,没钱但是心里不想还的,以及有钱但是我就是不还的。后面两种不还钱的人,我们定义他们为欺诈客户,就是来借钱之前想着不还的,对于前两种以及后面两种客户,我们的有不同的方式区别,

2、产品。不同的客户的客户特征是不同的,譬如贷款产品中会分出商人以及上班族的不同贷款,那么这时,我们假设客户的一个变量,工资流水,对于商人来说可能有淡季旺季,所以流水可能波动大,但是上班族,除了年终的时候会波动一下,其实时候毫无波澜。

3、行为。客户行为,是申请进件客户,还是还款中客户还是逾期需要催收的客户。

二、好坏客户定义

请看图,c-m1的意思就是正常客户变成逾期一期的占比,15年12月份有10000人来申请,那么在1月份有504个人逾期了,那么这504个人在2月份就是逾期一期的,跟着2月份来了,这504个人里面有77%还了钱就变成正常客户了,但是有23%的人还是不还,所以在2月份里面有大概116个人是2016年1月逾期了2期的人,接着3月份,这些有些还了一期的钱变成逾期两期的人,有些人全还了变成正常的人了,但是还有41.82%的人还是不还,那么3月是是2016年1月逾期了3期的人里面有大概49个人。到了4月份,之前3月份逾期了3期的那些人有些还钱了,但是还是有82.70%的人继续逾期,大概是40个人逾期4期了。五月份了,这40个人有那么4.33%的人选择了还钱,但是还有38个人继续不还钱,这38个人在五月份就是逾期了5期了,六月份了,这38个人有97.62%的还是继续不还,大概算一个人还了,可以看大随着逾期的期数越多,会还钱的人越来越少,可以根据转化率看到,最后的38个人与刚开始的49人,占比是77%,可以确定是的一旦客户逾期3期以上的时候就有很大的概率变成坏账客户。

定义逾期多少期我们可以定义为逾期客户之后,还需要确定还多少期之后的逾期三期的客户算坏客户,我们这里提一点是,我们本次的评分卡是围绕申请评分卡展开的,那么申请评分卡的定位客户是:想要还但是没钱还的,即会出现短期或者长期资金紧缺的情况,那么这里就需要提到“账龄”,在图中可以发现在9个月之后,坏账率趋于平缓,即在还了9个月到12个月期间的客户我们可以判定其是因为资金的不足才坏账的。即可以在9-12之间选择一个账龄,确定坏客户的标准。然而在一般是实战建模中与新巴塞尔资本协议中针对内部风险规范,也是建议12个月为单位较为合适。

三、准备建模样本数据

A卡一般可做贷款0-1年的信用分析,B卡则是在申请人有了一定行为后,有了较大数据进行的分析,一般为3-5年,C卡则对数据要求更大,需加入催收后客户反应等属性数据。

评分卡数据需要累积到一段时间达到数据量的时候才能见面,图中的横轴是一条时间轴,左边的为客户的观察期,右边为客户的展现期,那么刚才我们已经有了好坏定义,这时候就要用这个规则取数,假设我们刚才去的是12期逾期90+,那么这时候观察期就是12期+90天,展现期中逾期30天的客户就是坏客户,展现期没有逾期的客户就是好客户,那么这时候你会问还了12期的逾期30天的客户算什么,算不到展现期的客户,因为这时候你不能确定他是不是会在第31天就还上了。

如果你们是数学专业或者有上过多元统计分析这类的都知道,建模数据都会分训练集以及测试集,测试集的作用是测试训练集出来的模型可不可以对训练集之外的数据用,那么在实际建模中还会加一个验证集,测试集以及训练集的好坏比例是跟建模样本的比例是一样的,验证样本是取建模数据往后退大概一两个月的数据作为验证样本,这部分数据不仅测试模型能不能训练集之外客户可不可以用,还有验证模型是不是会随着时间的迁移而出现了效果偏差,但是模型效果出现偏差是肯定的,但是是否效果大幅度下降。

四、排除不可建模样本数据

排除不要的样本,以免影响变量效果,在风控系统中,被拒绝规则婉拒的客户我们不加入建模样本中,但是后期需要拒绝演绎还是需要这部分样本,为什么这部分数据不要呢,因为本身我们不能确定他是不是真的是坏的,这里要说明一点是,拒绝规则是拒绝掉那些可能性很大是坏客户的人,但是并不在公司的贷款中逾期,所以不能定义他就是坏的。

不到展现期客户,即在观察期的客户,就是刚开借钱,但是还了几期,还没逾期,不能判定是不是坏人也不能进入模型样本,至于还了多少期还没逾期的算好客户的,命中黑名单的客户也同样的道理。

五、讨论是否进行样本分群

刚才说的不同的产品会有不同的客户特征,但是即使同样的产品,同样的客户行为,那么样本还会有不同的特征,譬如男女的逾期表现在某种程度上来讲,女性逾期了会比男性低,所以如果在数据足够的前提下,可以考虑通过不同的方式对客户分群,分群的方式可以根据变量的分类的逾期率的不同,例如刚才讲的是男女分群,男女前提是这两种类型的人逾期率有一个差别,对于其他变量也一样。

建模准备一定要做的这几件事相关推荐

  1. linux离线安装ftp_安装Kali Linux之后要做的前10件事

    Kali Linux是基于Debian的发行版,由全球领先的信息安全培训公司之一 Offensive Security专门开发和维护,用于高级渗透测试和安全性. 它通常被称为黑客的理想操作系统,它是对 ...

  2. 一生里和你爱的人做完这50件事

    我想幸福 也许就是这么一件.一件积累起来的-- 一生里和你爱的人做完这50件事 1.布置一间书房,要一整面墙的大书柜,和你一起慢慢把它装满 2.和你背靠背,一边听我们都喜欢的CD,一边看各自的书,坐在 ...

  3. Ubuntu16.04 装机之后要做的二十件事

    Ubuntu装机之后要做的二十件事 用ubuntu做东西很久了,总结了一些教程,一直想整理一下,确实是没有时间,这下简单的整理了一下,大家可以看看,具体的软件安装包已经推到了本人的百度云帐号下面了,需 ...

  4. 阿里云研究员马涛:龙蜥社区做对了两件事

    在刚刚结束的 2022 云栖大会龙蜥操作系统峰会上,龙蜥社区理事长.阿里云研究员马涛进行了<开放算力,云启未来>的主题演讲,下文为演讲摘要. 我们相信操作系统将成为数字产业支柱算力来源,龙 ...

  5. 听说做过这30件事的情侣不容易分手

    听说做过这30件事的情侣不容易分手.1.每一周至少有一次约会的时间.2.聊天时多加一些语气词,"嗯嗯"改为"好哒","没有"改为" ...

  6. 零经验转行互联网,你需要做对这三件事,带你进入高薪产业,成就未来

    image 零经验转行互联网,你只做对了三件事 1.找准自己的职业定位 跟99%的应届毕业生一样,毕业过后,我找了一份养家糊口的工作,进入了一家世界500强的央企,开始了自己的第一份正式工作. 刚开始 ...

  7. 伯朗特机器人编程语言_伯朗特实现机器人出货量破5000,主要做了这五件事

    原标题:伯朗特实现机器人出货量破5000,主要做了这五件事 [文/潘敏瑶]2月1日,伯朗特发布年报显示,2018年营收4.52亿元,同比增长25.36%,归母净利4351.53万元,同比减少6.77% ...

  8. 程序员面试前只因为做了这几件事,成功征服了一系列大厂面试官。

    这篇文章适用于所有需要就业的小伙伴,不管你是名校毕业,还是双非出身,我相信这篇文章能给你带来一点点的小的收获! 我们先来了解这篇文章的主要脉络: 一份引人注目的简历 求职的各个关键时间点 投递简历的正 ...

  9. 为什么大家都做不好社交这件事?

    来自:Louis徐玮 人是群体动物,社交是底层需求.这么多年以来,人类底层需求从来没变过.互联网的产品经理看到了,想把社交这件事搬到互联网上.谁只要垄断了社交,上亿市值不是梦.但似乎大家都没怎么做成. ...

最新文章

  1. 我们试着用FBI的方法破解了一台安卓机
  2. 小米造车150天:烈火烹油第一枪
  3. 从RocketMQ看长轮询(Long Polling)
  4. Chrome OS 云里雾里
  5. 30 个实例详解 TOP 命令
  6. bs cs架构区别_软件架构设计分层模型和构图思考
  7. 讲点码德!避免这些代码坏味道,努力做一名优秀的程序员
  8. 【Oracle】truncate分区表
  9. 路径规划之RRT类算法简述
  10. 常用的加密算法--摘要认证和签名认证的实现
  11. 关于 bind 你可能需要了解的知识点以及使用场景
  12. Vue+springboot流浪宠物救助领养网站
  13. 统计学之大数定律、小数法则
  14. java之xml进阶教程——使用castor框架
  15. gitgithub快速入门
  16. 事实、循环、条件判断
  17. StoryBoard 创建tabBarController
  18. 煤炭销售系统的设计与实现
  19. JS实现百度地图搜索悬浮窗功能
  20. 90页PPT详细介绍大数据治理平台解决方案|附PPT下载

热门文章

  1. sql server 中获取前一天日期_图解SQL面试题:如何比较日期数据?
  2. android平板 2017,2017年后平板电脑市场将复苏
  3. 字符集:ASCII、GB2312、GBK、GB18030、Unicode
  4. hashlist java_java中集合类HashSet、ArrayList、LinkedList总结
  5. java web 购物车_java web开发之实现购物车功能
  6. Deepin15.7 Android8.1 编译 以及问题解决
  7. c++ const 常指针
  8. not in the sudoers file. This incident will be reported.
  9. 修改PostgreSQL数据库默认用户postgres的密码
  10. 安卓桌面软件哪个好_安卓模拟器哪个比较好?