数据监控

  • 前言
  • 如何做数据监控
  • 信贷风控中的业务指标
  • 监控部署
  • 监控数据异常分析(思路可衍生到传统数据分析)
  • 总结

前言

无论是数据分析还是数据建模分析的工作属于前期工作,后期的维护还需要严格监控来维持。日常的监控数据一方面会让我们更加了解公司的业务、流程以及整个产品的概况,另一个更加重要的方面是当生产或者某个环节出现问题时,能让我们及时了解,快速定位到问题进而解决问题,避免给公司造成更大的损失

如何做数据监控

信贷风控中的业务指标

数据监控的指标一般思路是产品的流程及与Kpi相关的核心指标。遵循的基本原则基本上是顺着产品流程线的基础上先总体再个体。以下图信贷大体流程图做简单介绍:
一、总体
对于任何公司利润是第一位的。从风控的角度来说信贷公司通过率越大(放款越多),还款的人越多(贷后逾期越低)公司的总收入会越多。(在实际中通过率和逾期会有一个平衡点,也就是保持一定逾期范围内使得通过率最大能达到信贷公司利益最大化,并不是说单纯保持逾期这越底越好或者通过率越高越好。这个平衡点与利率、成本等多方面因素有关)
二、个体
一个公司的产品(或者不同客群)可能不止一个,所部署的策略、模型及反欺诈各不相同。总体的通过率和逾期率的监控可能并不能反映每个产品的情况。因此需要从不同产品(或者不同客群)来进行监控
三、流程线
上图是信贷行业一个大致的流程图,主要会涉及运营、风控和贷后3个主要的大部门。在进件前到进件这一块运营部门需要注重转化率的提高(成本投放出去,运营过来的人需要带来最大化业绩量);在进件到发标放款阶段风控部门需要识别风险客户做好准入及额度制定;在放款后至还款的阶段贷后部门需要制定好优秀的分案策略保证催收的效果
四、确定监控指标(以风控部门为例)
流程线的基础上监控
(1)总体+流程线: 进件量、实名认证失败比例、反欺诈拒绝比例、风控规则拒绝比例、模型拒绝比例、通过率、发标率、放款金额、T0逾期、T3逾期、T7逾期、T30逾期、vintage曲线
(2)个体+流程线:总体+流程线的监控指标的基础上,分人群来监控这些指标。例如ios与安卓进来的人群特征,所部署的策略差别很大。需要将这2波人群分别拆开监控

监控部署

监控指标的部署按照上述的流程及顺序部署。可以根据需求(领导的要求)按小时、天、周、月等时间维度来进行监控

(1)监控软件。每个公司都有自己的开发或者购买的监控软件。很多时候也是需要自己开发实现。这里推荐python。python可以实现大数据平台连接(pyhive)、与excel连接(xlwt)、写出html(pyecharts)以及自动化邮件(smtplib、email)等接口。如果是实时监控业务指标推荐使用datav与数据库的结合
(2)监控细节的部署。整个流程的风控指标基本满足,风控部门下有很多小部门。例如:
a)反欺诈部门中在反欺诈比例这一个业务指标的监控中可以细化到黑名单、地域等规则的详细拒绝比例
b)模型组前端(进件、放款):进件量、评分卡均值、评分卡分10档分组占比、评分PSI波动;变量均值、缺失率、PSI波动,变量分bin
c)模型组后端:每周放款件及对应逾期率、auc、ks、Lift图、变量分bin、变量iv、变量TP图
(3)特定需求监控。除产品流程外,可能还有一些特定的分析。例如在信贷中放款人在一个月之后才会有表现,希望能够在进件时就能了解人群大概情况,做到风险前置。进件或者放款人群的变量分布或者均值(如年龄、模型分、性别、多头等)监控

监控数据异常分析(思路可衍生到传统数据分析)


监控的部署主要是为了及时发现异常问题,及时处理避免损耗。上图展示的是当数据产生波动时需要做的分析。每天都会有某指标突然升高等数据分析的需求,需要快速定位并决定是否有深入研究的必要来提高工作效率并保证不会出现重大生产事故。以信贷中总体通过率突然升高为例做分析:
(1)判断总体通过率异常是否正常波动。例如总体通过率在工作日要比周末要低一个点,并且以往的监控中都是呈现这样的周期性。那么周一观察到的周末通过率升高一个点属于正常,可暂时放弃深入分析,等周二监控周一数据是否有所下降决定是否进一步深入分析。如果无法判断是否正常或者判断是异常就需要进一步升入分析(对业务熟悉的人基本可以大体判断数据波动是否是正常波动)
(2)通过拆解的方式精准定位问题。总体通过率上升可以拆人群,定位到是ios还是安卓渠道通过率上升带来总体通过率的上升(例如定位到了ios)
(3)提出假设、数据支撑。当定位到ios渠道后,可以提出下图的一些假设,提出假设后去寻找相关数据支持我们的假设进而得出结论,如果数据都支撑不了提出的假设,需要提出新的假设重新寻找数据来支撑

(4)得出结论,制定解决方案。找到数据支撑定位出问题之后,需要制定有效的可行性方案。例如通过率上升是由模型分的偏移造成的,需要让模型组去检验一下模型分上升的原因,模型部署的是否准确,以及接口调用的是否正常等,然后针对问题进一步解决

总结

  1. 监控的目的可以帮助我们了解业务,及时发现问题进行止损(最重要)
  2. 监控的数据分析可以通过拆与假设2方面高效的解决问题
  3. 具有业务的数据分析才称得上一个好的数据分析,产生的效益更明显(工作中)

注:监控的搭建过程也能提高我们的思维与技术能力

信贷风控之数据监控与分析相关推荐

  1. 信贷全生命周期监控报表开发

    对于任何一家从事信贷业务的机构而言,监控报表的设计及搭建尤为重要.因为监控报表不仅涉及信贷风控的资产监控,更能反馈客群质量的变化.内部管理手段的调整.策略规则对客群质量的影响等方面.为此,番茄风控输出 ...

  2. 场景风控的商户监控,这两大数据指标掌握了吗

    在消费场景分期中,医美分期经过了历史众多机构的白热化竞争后,终于也迎来了一个剩者为王的时期.就目前而言医美分期还是一个重要细分的消金场景. 在番茄风控之前的课程中我们有给大家,介绍过医美场景风控的相关 ...

  3. 基础篇|信贷风控中的外部数据(百行)

    序言: 外部数据源作为金融机构判客群风险最重要的征信维度,其作用不需多言,在信贷行业最风控的时候,某家机构公司数据成本占比居高不下,甚至是成本中较重的支出,比如在某集团公司里就会接入以下这些数据源: ...

  4. 概述:机器学习和大数据技术在信贷风控场景中的应用

    来源:知乎 本文约5400字,建议阅读10分钟 本文简要概述在当前大数据和机器学习技术如何在信贷风控场景下的常见应用. 似乎一夜之间,所有的互联网公司在对外的宣传稿中都会提及自己使用机器学习和大数据技 ...

  5. 个人金融借贷场景下,大数据风控的行业分析及应用分析

    一.大数据风控是什么? 大数据风控按照通俗的概念解析:通过运用大数据构建模型的方法对借款人进行风险控制和风险提示. 这句话涵盖大数据风控必要的4个要素: 1. 原材料:大数据 2. 实现方式:技术模型 ...

  6. 电商支付数据在信贷风控中的应用

    笔者在之前的工作经历中,曾做过针对电商/支付数据开发信用资质分的一个项目,下面我会介绍这两类数据是如何应用在信贷风控中的,内容包括电商支付数据的使用场景,做风险特征衍生的思路,以及在策略及模型上的应用 ...

  7. 年终总结系列3|信贷风控的贷后分析报告总结

    序言: 信贷用户的贷后表现是信贷产品体系一项非常重要的模块,贷后数据与贷前数据的指标分析,不仅可以直接反映出产品的整体收益情况,而且是很多数据挖掘与模型开发等工作任务的前提条件.现以某公司线上小额信贷 ...

  8. 信贷风控二:一款线上信贷产品该有哪些数据

    信贷风控二:一款线上信贷产品该有哪些数据 一.基本信息类 二.埋点行为类 三.设备信息类 四.三方数据 如今各行各业都在提倡大数据和数字化管理,在信贷领域更是如此,包括传统金融机构,也都在积极推进数字 ...

  9. App性能分析数据监控

    App性能分析数据监控 APP的性能监控包括: CPU 占用率.内存使用情况.网络状况监控.启动时闪退.卡顿.FPS.使用时崩溃.耗电量监控.流量监控等等. 文中所有代码都已同步到github中,有兴 ...

最新文章

  1. 【通俗理解线性代数】 -- 矩阵的等价与相似
  2. usb linux 内核,Linux下USB内核之学习笔记
  3. 这周末,清华迎来了最小的学生和最牛的老师,Science都点赞的那种
  4. Things That Cannot Change
  5. python在文本添加超链接_Python将超链接文本打印到Spyder控制台(Python print hyperlinked text to Spyder Console)...
  6. OVS+DPDK Datapath 包分类技术
  7. java 获取classpath下文件多种方式
  8. Axure通用web端元件库rplib文件格式+移动端app通用元件库rplib文件格式+电脑端动态可视化图表元件库+数据展示+操作反馈+通用模板+数据录入+列表页+表单页+详情页+通用版布局
  9. 如何在终端编辑文件并保存
  10. 如何在VB6.0里动态使用具有事件的对象
  11. 学生寝室管理系统-C语言版
  12. autojs之提取图片中的红色文字(通过找边界进行裁剪)
  13. dirent.h使用详解
  14. 哈夫模型-arcgis
  15. 微信支付指纹上传服务器,指纹安全吗,支付宝、微信支付会上传用户的指纹吗...
  16. 为什么不建议执行超过3表以上的多表关联查询?
  17. 什么表单设计工具能快速提升办公效率?
  18. 前端网页生成二维码方法
  19. 深度学习CV文章整理
  20. 书法字帖 PDF转化为可打印PDF

热门文章

  1. xshell远程连接服务
  2. 基于卷积神经网络的心音信号识别
  3. MIPI学习记录——初识mipi
  4. ansys 内聚力模型_内聚力界面单元与复合材料的界面损伤分析
  5. 全球最好的外贸B2B平台有哪些
  6. web项目部署架构图
  7. mysql ssd inodb,技术译文 | MySQL 8 需要多大的 innodb_buffer_pool_instances 值(上)
  8. 物联网在智能交通中的应用前景
  9. 实现医生工作站中处方录入功能的代码(六)
  10. SMMU架构手册之Address Size(2)