你模型的变量符合业务逻辑了吗
关注 “番茄风控大数据”,获取更多数据分析与风控大数据的实用干货。
模型开发中,经常需要对变量做各种统计分析,而且在分析前还需要跟业务跟产品的同事碰一下变量的逻辑。刚从事模型开发的同学,或者算法转型过来的同学。经常因为一些业务细节,忽略了某些变量的分类。我看过的很多都是栽倒在变量的分箱上,自己也经常遇到这样的场景。
比如对于贷前评分卡中的某个变量——3个月的内安装信贷app的单的个数,当时在批量分析变量时,这个变量的IV值还特别高。当时非常兴奋,觉得这个变量非常有区分能力,打算马上写个报告把这条变量做成规则。
但后来重新批量跑数据的统计分析时,批量分析每个变量的缺失度,该变量的缺失程度竟然高达85%。后来经过分析,IV值特别高的原因还真是缺失的关系引起的。(大家想一下具体的原因?)
后来顺着具体的逻辑分析下去,才发现在匹配这列的时候,有很多值其实是有值的,该值等于 0。但是数据分析的同事,不太理解里面的业务逻辑,直接将部分的0值删除了。了解业务的话,会知道这个变量的业务逻辑是由该客户的身份证或手机号码匹配得到,所以在业务上来解释。该值在等于0和为空(null)是完全不同的解释。
为空代表着手机或者身份证是匹配不到相应的客户的信息,为0代表着是该客户的没有安装相关的贷款APP,对应的风险等级非常低。在业务上区分不了这两者的区别,就会造成错误分箱。但这还不是造成严重错误的分箱,因为在这个场景里为空查询不到具体的风险情况的时候,还可以单独列出来监控。但在某些一些变量里,区分不清楚两者的关系会造成非常大的起义,甚至损失。
这里再聚一个变量衍生例子。变量衍生是经常做特征工程需要处理的事情,因为当变量数量不太具有某些区分能力或者想要增加一些分析维度的时候,我们经常再做变量衍生。
“欠款金额”就是这样的一个变量,欠款金额(dep_among),根据字面含义欠款金金额越大,代表客户的风险越高。但这个变量里的值有些为0,有些为空。根据这个变量的业务逻辑,0代表着客户之前有过欠款,目前可能已经还清了;空值,表示客户从来没有欠款或者从来没有贷款记录。这个后者在征信上代表着白户,这在很多信贷产品中,有些是准入都无法放开的客户。所以变量取值看似相近,但却有非常大不同。“细思极妙”,往深度些思考,这里面的逻辑的确非常耐人寻味。
什么样的模型所生成的变量也不太一样。刚才前面的变量都是贷前审批的模型,而在反欺诈模型里,用到的模型变量又非常不同了。比如经常会用到的关系网络模型里,里面经常需要用到的更多的是一致性的变量,交叉变量等,如:手机号一致数量,居住地址一致数量 ,家庭电话一致数量,单位名称一致数量,单位地址一致数量…以上这些都是属于交叉,一致性会入模的变量。
关于变量的业务逻辑今天先简单些聊到这里,后续可以再继续跟各位分享更多的一些衍生内容。
---------------------- --------------------- ------------------------------------- ----------------------
十年职场生涯,这个长期混迹在风控界和科技界,摸爬滚打的大叔,曾经就职于全国最大的固网运营商平台、国内最大的ERP软件公司和一家老牌的互金公司,如果你想了解他,欢迎关注 “番茄风控大数据”一起学习一起聊!
你模型的变量符合业务逻辑了吗相关推荐
- 【C 语言】字符串拷贝 ( 字符串拷贝业务逻辑代码 | 分离 主函数 与 字符串拷贝 业务模型 )
文章目录 一.字符串拷贝业务逻辑代码 二.分离 主函数 与 字符串拷贝 业务模型 一.字符串拷贝业务逻辑代码 下面的代码 , 是 字符串 拷贝 最简单的代码 , 仅 使用 指针 遍历内存 , 实现了字 ...
- sas构建评分卡模型过程详解(二):变量筛选及逻辑回归
上一篇已经将所有变量都转化为woe值的形式,这里再另外补充一个小技巧-dummy变量的使用. 1.有时候我们的数据来源可能不是很真实,如客户自己填写的婚姻状况,假设婚姻状况不会要求客户提供证明,但此时 ...
- m5310模组数据上传至onenet_硬核干货!基于M5310-A的NB-IoT水表通信模块软件业务逻辑分享...
根据不同的应用场景需求,目前NB-IoT水表主要有以下几种方案: 图1 几种常见NB水表方案 接下来将从NB-IoT水表上电开机.模组初始化.入网判断.业务逻辑四个环节来详细讲述,以下业务流程仅供参考 ...
- Java 的业务逻辑验证框架 fluent-validator
背景 在互联网行业中,基于 Java 开发的业务类系统,不管是服务端还是客户端,业务逻辑代码的更新往往是非常频繁的,这源于功能的快速迭代特性.在一般公司内部,特别是使用 Java web 技术构建的平 ...
- petshop详解之五:PetShop之业务逻辑层设计
五 PetShop之业务逻辑层设计业务逻辑层(Business Logic Layer)无疑是系统架构中体现核心价值的部分.它的关注点主要集中在业务规则的制定.业务流程的实现等与业务需求有关的系统设计 ...
- 使用 Drools 规则引擎实现业务逻辑,可调试drl文件
http://www.srcsky.com/tech/arts/389.html 代码下载http://download.csdn.net/detail/zhy011525/2462313 使用 Dr ...
- petshop4.0 详解之五(PetShop之业务逻辑层设计)[转]
业务逻辑层(Business Logic Layer)无疑是系统架构中体现核心价值的部分.它的关注点主要集中在业务规则的制定.业务流程的实现等与业务需求有关的系统设计,也即是说它是与系统所应对的领域( ...
- petshop4.0 详解之五(PetShop之业务逻辑层设计)
五 PetShop之业务逻辑层设计 业务逻辑层(Business Logic Layer)无疑是系统架构中体现核心价值的部分.它的关注点主要集中在业务规则的制定.业务流程的实现等与业务需求有关的系统设 ...
- PetShop之业务逻辑层设计
<解剖PetShop>系列之五 五 PetShop之业务逻辑层设计 业务逻辑层(Business Logic Layer)无疑是系统架构中体现核心价值的部分.它的关注点主要集中在业务规则的 ...
最新文章
- *1408素数回文数的个数
- 14.结构体struct.rs
- 阿里P8架构师谈:架构设计经验汇总
- ModuleNotFoundError: No module named ‘torch.utils.serialization‘解决
- app.vue 跳转页面_【在线教学】第8章 网站页面布局和模块设计
- iloc,ix和loc有何不同?
- wordpress如何让百度快速收录_百度搜狗蜘蛛池让你的新网站内页快速收录
- careercup-链表 2.7
- web网页对话框的一些设置
- linux专业画图工具astah下载和安装
- Python报错:ImportError: cannot import name 'downsample'
- 支配树 / Dominator_Tree(待补)
- linux 服务器搭建opvn
- Android APP - GPS定位并获取地理位置
- 物联网行业解决方案之智慧畜牧
- 上升了百分之几怎么算_上涨百分之多少怎么算
- 成功的设计是什么?商业成功+工艺成功
- 权限提升之——数据库提权
- 如何模拟苹果官网高端大气上档次的产品视频演示
- 小米平板5ProWIFI(elish)刷ArrowOS
热门文章
- poj java 输入超时_Java:如何实现代码超时功能?
- java 调用plc程序_从老师傅那里偷学来的PLC宝贵经验!
- xhr请求python_Python爬虫进阶必备!关于某电商网站的加密请求头!
- java素数判断连续素数_java 判断一个数是素数(优化)
- excel数据库_EXCEL憋出大招,逆袭大数据的黑马出现了
- phpexcel删除行_php - PHPExcel从大型工作表中删除行 - 堆栈内存溢出
- Python包和模块的使用方法
- R语音:解决cor.test报错的 'y'必需是数值矢量
- jfinal 任务调度与jsoup 爬虫
- C#下拉列表绑定数据库的使用三层实现