国庆七天假,就这样飞快结束,似乎感觉还没休息够,再来一个七天都不觉得多多。
经过多年来移动互联网的普及,众多APP已采集到亿级乃至数十亿级别用户在设备端、通话、短信、地址等强变量的数据,伴随着近年来信贷行业高速发展,基于设备端采集到数据应用在信贷业务反欺诈及信用风险识别上,已经司空见惯。
这里所提到的行为,多数就是跟数据埋点相关的内容。埋点是一种用户行为数据化的记录,基于业务或者产品需求,对用户在产品内产生行为的每一个事件对应的页面、位置、属性等植入相关代码,并通过采集工具上报统计,采集的数据可以用来分析网站/APP的使用情况,用户的使用习惯等等,延伸出用户画像、用户偏好、转化路径等一系列数据产品。
通常数据埋点都会采用5W原则进行设计:

一.埋点所能获取数据维度
首先我们需要理解在风险管理过程中,数据埋点提供了更多的可解释依据,帮助问题归因,数据埋点是做好风险管理的底层支撑。而一个好的数据埋点最应该接触的就是一个产品流程。
一个完整的产品流程,从产品进件->审核->放款->贷后监控这一整条业务链条中,都会涉及相关数据。而其中最重要的数据采集基本都集中在贷前行为埋设。
而贷前行为又可以拆解为以下内容:注册->登陆->人脸识别…等这一系列动作。比如注册环节中最开始的一个欢迎页面,我们是否需要做埋点?如下面某产品的实际首页中:

最开始的欢迎页面,里面我们有哪些数据可埋设,有哪些策略可制定?有经验的数据分析师都应该实操下自家的产品,除了成功登陆页面外,会进入下一步的实操;而在输出密码错误则会出现有如下提示:

如图所示,一旦密码输错了,无法进入下个页面。那根据后台获取到的数据,有经验的策略分析人员至少需要思考两点,一个是次数另一个是时间,于是我们可以整理为:1.密码输入的错误的次数2.埋点中“欢迎页面”所停留的时间…这里,错误的次数设置几次合适?停留的时间多长才算合理?这是策略分析人员需要考虑的问题。
后续,在这个首页的埋点之后,如果有OCR识别,我们将会再设计一个策略:
《OCR识别,客户可修改》

OCR维度可修改,这个还不算是一个最终能使用的维度。这个维度需要进一步拆分,可以拆分成哪些维度?

从OCR,图像识别上有哪些信息思考,这个内容就不难回答。不外乎是身份证正反面照/证件号/出生日期/姓名。综合这几个信息,我们就可以进一步将OCR维度往这几个颗粒度拆分。
除了这几个维度,还有吗?当然有,大家可以进一步思考,我们将在本周日即将开课的《信贷数据策略埋点》的星球课堂中进一步跟大家拆解。

二.埋点数据所衍生的强相关变量
基于以上的的数据埋点中,我们获取了这些埋点数据,那跟信贷业务强相关的维度又是哪些?

目前可应用于信贷数据维度包括已安装APP数量及APP对应类型、APP流量使用情况、wifi信息、通话详单、通讯录等维度,综合这些分析维度目前我们可以将APP可获取的相关的数据维度,加以清洗之后再划分为以下几大部分,分别是:基础信息、价值属性、行为偏好、信贷属性、综合评分
本文仅列举其中的两个部分具体介绍:

1.基础信息
基础信息中包括设备属性、人口属性、社会属性、稳定性、黑名单,具体字段列举如下:

这里所提到的设备属性、人口属性、社会属性、稳定性、黑名单,具体字段如果拆开来讲细节很多,比如人口属性如上表所示,可衍生的细则就很多,其中设备指纹就是非常重要的一个数据。
另外再介绍基础信息中稳定性这个指标。之所以会挑这个指标,因为这个指标会涉及两个稍难点的内容,分别是:个人稳定性与家庭稳定性。特别是个人稳定性,会涉及到一个geohash的概念。以下,我们详解讲解:
个人稳定性,我们计算个人geohash的变动数据——
计算的逻辑是近4周 geohash停驻点个数 。这个geohash是什么意思?geohash是gps 的替代采集字段,是采集直径5km 的圆 。这个计算公式,就是通过计算近4周 geohash累积频次,从而筛选出目标的稳定停驻点的数据,从而判断目标是否稳定。
而家庭稳定性,稍微容易理解些。家庭稳定性,计算的逻辑是近12周家庭地址的变动次数 。我们会聚合12周家庭地的数据,计算家庭地变动次数。

2.信贷属性
另一个跟信贷业务较为强相关的部分就是信贷属性这个维度。信贷属性基于APP的信贷偏好及高危行为 。信贷属性中包括信贷偏好、高危行为。具体字段如下:
金融类 APP当前安装个数等小贷类 APP的安装个数与网贷p2p标签 …
既然是APP的分类,就会涉及APP的规类问题。打开手机APP哪个是属于信贷类的?哪些是属于学习类的?哪些是属于母婴类的?这些APP都是怎么分类?这里就需要我们在内部存储一个APP分类库,其中在APP分类库中最重要的就是金融类APP的明细清单,具体的借贷APP的明细清单参考如下:

以上内容参考至:
番茄风控会员社区《知识星球》内容
番茄风控社区历史会员课程《 Applist特征工程介绍》

~原创文章

这些信贷数据埋点中不得不知的埋点知识相关推荐

  1. 9 单元测试中不得不知的概念

    单元测试中不得不知的概念 前言 软件单元及单元测试 驱动函数和桩函数 总结 前言 做单元测试,如果不弄清楚什么是单元,那十八般武器也无的放矢了.可能在单元测试中听到最多的就是驱动函数.桩函数和逻辑覆盖 ...

  2. 数据中台建设中的得与失

     本文根据新康众数据中台负责人闫顺成<数据中台建设中的得与失>的演讲整理.主要内容如下: 一.什么是数据中台 每个企业.每个岗位.每个人对数据中台的理解都有所不同.在阿里,数据中台与方法论 ...

  3. 新康众闫顺成:数据中台建设中的得与失

    本文根据新康众数据中台负责人闫顺成<数据中台建设中的得与失>的演讲整理.主要内容如下: 一.什么是数据中台 每个企业.每个岗位.每个人对数据中台的理解都有所不同.在阿里,数据中台与方法论. ...

  4. 神策数据埋点大升级,一站式埋点,360° 满足你的不同场景需求

    埋点,就像是人的五感,人的五感用来接收视觉.听觉.触觉等多样化的信息:而埋点,是用来采集结构化的行为数据与业务数据. 人失去了五感中的一感,生活就会产生极大地不便,而做「互联网+」的业务,如果没有精确 ...

  5. java arrays方法_Java工具类Arrays中不得不知的常用方法

    原标题:Java工具类Arrays中不得不知的常用方法 Arrays 数组操作集数组转List ---asList 这个被"普遍"称为数组转List的方法,可能是Arrays内大家 ...

  6. c语言字母是怎么存储,C语言之数据在内存中的存储

    C语言之数据在内存中的存储 在我们学习此之前,我们先来回忆一下C语言中都有哪些数据类型呢? 首先我们来看看C语言中的基本的内置类型: char //字符数据类型 short //短整型 int //整 ...

  7. sap客户信贷_FD32维护客户信贷数据

    一.说明 T-CODE:FD32只在ECC中使用,在S4 HANA中,被BP:角色"UKM000 SAP信贷管理"取代. 在SAP中,客户的信贷包含两级数据视图,分别是常规数据视图 ...

  8. 数据埋点是什么?设置埋点的意义是什么?

    作者:原志Growing 链接:https://www.zhihu.com/question/36411025/answer/654557035 来源:知乎 著作权归作者所有.商业转载请联系作者获得授 ...

  9. DNS解析过程中不得不知道的那些事

    DNS解析过程中不得不知道的那些事 0x01 定义 0x02 域名结构 0x03 DNS查询方式 1.从查询方式分类 2.从查询内容: 0x04 常见的DNS资源记录 1.A/AAAA记录 2.CNA ...

最新文章

  1. Swift2.x编写NavigationController动态缩放titleView
  2. MOOON-server新消息处理接口
  3. 火狐浏览器设置cookie失败_IE、谷歌Cookie记录失败,火狐成功(IE和Firefox下的Cookie兼容问题)...
  4. mysql 导入dmp_oracle的备份文件(dmp)导入mysql数据库方法
  5. [转]使用Navicat for Oracle工具连接oracle的
  6. Docker Consul 安装及使用服务发现
  7. 6_less中的匹配模式
  8. mysql 1000万数据读取_插入1000万条数据到mysql数据库表
  9. ubuntu good 便签
  10. Word2013 设置默认缩进
  11. 手机游戏上线前的准备
  12. 图解通信原理与案例分析-18:低功耗、远距离物联网无线通信技术LoRa概述与扩频通信的基本原理
  13. jdk8下载与安装教程
  14. 小学计算机说课稿,小学优秀信息技术说课稿
  15. Spark 学习路线
  16. 母亲节,表格交给我们,你早点回家
  17. blast2go windows 下本地化
  18. linux drwxr-xr-x 是什么意思
  19. 自监督论文阅读笔记 Synergistic Self-supervised and Quantization Learning
  20. 椭圆曲线加密中定义的加法运算

热门文章

  1. 火灾检测参考资料与数据集
  2. python计算行列式(使用下三角方式)
  3. UDF函数maven工程出现:Missing artifact javax.jdo:jdo2-api:jar:2.3-ec或xsi:schemaLocation=http://maven.apach
  4. mac怎么更新python_mac上更新python的方法
  5. CSS3 低多边形(Low Poly)设计及开发实例 - 简单的字母
  6. php tp 聚合数据接口,TP5结合聚合数据天气预报API查询天气
  7. 数据分析-思维分析逻辑day02
  8. request:fail 发生了 SSL 错误无法建立与该服务器的安全连接——openssl报漏洞该升级了
  9. 感抗、容抗、阻抗 计算
  10. 服务器常用语言,计算机常用词汇--语言及服务器篇