随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精细化运营及精准营销服务,进而深入挖掘潜在的商业价值。于是,用户画像的概念也就应运而生。

在推荐系统中,
【推荐系统内容,详情可以关注番茄风控往期课程:信贷风控也要学|智能推荐系统的应用】
做好了标签可以实现精准化营销和推送;在信贷行业,有了标签体系不仅可以帮我们实现客户分群,实现风险把控。业内,我们除了模型也一直在想方设法构建客群的标签体系,关于风险相关的标签情况,之前在风控风控往期的内容中也有跟大家介绍,今天我们再来谈谈相关内容。

一.系统功能架构
首先一个完整的标签体系,用户画像及应用项目包括底层数据源采集和存储、画像标签模型构建、数据模型应用三个层级,系统功能架构如下:

二.模型架构
画像标签模型分析主要分原始数据统计分析、统计标签建模分析、模型标签预测分析三块,具体如下:

三.用户画像模型
用户画像模型是结合用户基本属性分析,对互联网行为特征进行描述,包括用户登录、搜索、关注、消费等各方面数据,在信贷风控的全流程中,我们就会除了会判断客户的档案信息也更会参考他的征信情况、还款行为、催收数据,以标签方式展示每个用户的个性化特征,画像是系统分析结果的总结,是系统数据挖掘的起始。目前在画像中所用到的一些分析方法如下:
聚类分析
聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的.聚类结果要求组内对象相似性较高,组间对象相似性较低.在用户研究中,很多问题可以借助聚类分析来解决,比如用户活跃度行为聚类、用户消费情况聚类等.
分类算法
分类是按照某种标准给用户贴标签,再根据标签来区分归类,分类是事先定义好类别,类别数不变.根据用户群的文化观念,订单消费、行为习惯等不同细分新的类别,企业根据用户的不同制定品牌推广战略和营销策略,将资源针对目标用户集中使用.
时间序列分析
时间序列分析是一种动态的数据统计方法.该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题.比如用户的周期性行为分析、因子回归分析建模等.
RFM模型
RFM模型较为动态地显示一个用户的全部轮廓,R表示用户购买的时间有多远,F表示用户在时间内购买的次数,M表示用户在时间内购买的金额,加权得到RFM得分.
推荐系统算法
利用用户的一些行为,通过一些算法(协同过滤、LFM、打分模型、关联分析等),推测出用户可能喜欢的东西.推荐讲究准确性,提高用户-内容(订单、知识等)等组合的匹配度,提升服务质量.
关联分析
关联分析就是在关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构,挖掘潜在的行为和消费关联特征.

四.贷款属性标签
因为篇幅有限,本文稍微列出跟风险标签稍微相关的贷款情况的标签内容,另外还有更详细的档案情况跟贷后表现数据标签,请参考知识星球上的内容:

还有关于标签的相关的图表、热力图、词云就不做过多展示:

以上说的各种高大上的标签体系的内容,相信各位童鞋多多少少都会遇到,但并不一定适合各位金融机构,特别是因为个人隐私保护,许多方面的标签内容早已获取不到。特别是在金融科技助贷等场景中,许多助贷的业务中标签的确实是常见的现象。
这种情况下,我们常常借助三方数据的标签标识,来获取相关的数据从而协助我们建模。

五.常见的一些三方数据返回的标签数据
比如在助贷类公司A与资金类公司B在合作过程中,A公司常常需要对B公司要求返回的用户群体进行风控筛选,这里的风险筛选工作其中一个工作便是建模。但B公司常规上,不会返回相关的标签给到A。于是A公司如何在缺乏数据标签情况下建模呢?
常常用的一个方法就是调取第三方数据厂商,希望返回类催收数据作为Y标签。什么是类催收数据,就是跟催收相似的数据。比如催收次数、催收时长、催收等,具体的类催收数据可以参考:

使用类催收数据的逻辑是,客户是因为表现不好才会进入到贷后催收,所以才有跟贷后相关的数据。
最后A公司决定使用催收次数作为相关标签进行定义,该数据标签也是很明显的数值。那我们就可以根据具体的业务情况,把这个客户在最近1个月内被催收了10次,把这个客户定义为坏客户。
解决了用什么样的数据去定义标签是一个非常重要的问题,随之,又伴随着另一个问题就是如何怎么选取客户样本?
假设根据B公司的使用情况来分析,B公司一个月调用的数据量在十万+的数量级的用户,因为存在数据成本调用,总不能所有的数据都来调用。常规上,大家想到的是随机抽取的方法,将样本压缩在1万条左右。
因随机抽取是可以将成本大幅降低了,但因为抽取过程中,会将B公司调用样本的过程中,拒绝的客户也抽取到。假设B公司的拒绝量达到90%左右,那也就是说,我们抽取的客户数,有很大一部分是混淆着拒绝客户的。在模型里有个概念:拒绝的坏跟进件后逾期的坏客群是不一样的坏,这得分属两种不同的范畴。
拒绝掉的客群,肯定是黑名单或者某些准入的关系被拒之门外的。所以这部分客群被拒是跟政策或者欺诈类相关的。在风控系统里,最外层的也是拒绝规则。客户准入后,又是因为信用情况烂掉被归为坏的,又属于信用风险的范畴。这是两类不同的风险。
所以在抽取中,我们需要在自己的业务系统跑完通用的规则如黑名单库、准入规则再进行抽取,这样总比随机抽取的客群来的好。后续便是用用这波客群进入贷后再去查询相关的贷后数据。之后便是计算模型验证指标,后续持续滚动模型,再去纠正之前的数据情况不断建立模型,监控模型效果,一直迭代模型直到最优。

以上内容参考:
①第80期课程信贷风控也要学|智能推荐系统的应用
②第49期课程《 策略分析之数据监控与用户标签画像》

~原创文章

风控标签体系的使用与介绍相关推荐

  1. 用户画像标签体系包括哪些维度?有哪些应用场景?(附完整导图)

    导读:本文详细介绍用户标签体系的构成及应用场景. 作者:赵宏田 来源:大数据DT(ID:hzdashuju) 互联网相关企业在建立用户画像时一般除了基于用户维度(userid)建立一套用户标签体系外, ...

  2. 王欢:如何构建好的智能风控工具体系?

    本文约4600字,建议阅读9分钟本文将介绍在风控实践中积累起来的一些标准化的工作,包括遇到的问题和采取的解决方案,以期构建一个好的智能风控工具体系. 本文由融360高级数据算法工程师王欢老师带来&qu ...

  3. 【标签画像系列】标签体系建设方法论

    5月11日录制了袋鼠云数栈全新数据中台精讲系列 --「数智赋能实战六讲」的第一场直播,主要对标签体系的建设进行了抽象,分成几个步骤,方便大家理解. 你能看到 ▫ 数字营销是数字化转型排头兵 ▫ 标签体 ...

  4. 全面了解风控策略体系

    模型和策略的开发是一个系统工程,这其中需要有业务经验.统计理论.算法运用.和数据认知,是一个不断反思,不断积累经验的过程.沙滩上建不起摩天大楼.扎扎实实的基本功永远有价值,永远不会过时. --余旭鑫博 ...

  5. 如何真正理解用户标签体系?

    对用户标签的理解不够透彻? 用户标签体系创建的方法论总是三头两绪? 具体业务场景中,经常找不到数据分析的思路? 本文根据神策数据业务咨询师钟秉哲以<构建用户标签体系,助力企业精细化运营>为 ...

  6. 基于神策用户画像,在线教育企业线索标签体系搭建及培育全流程解析

    作者介绍:TigerHu,环球网校大数据营销产品 leader,主导数据产品线和营销 CRM 产品线. 本文内容均从作者真实实践过程出发,结合作者公司与神策数据合作真实场景,从神策用户画像产品出发,全 ...

  7. 玩转用户标签体系,打造精细化运营底层能力 | 芒种训练营第一课

    本文根据 2020 神策数据分析芒种训练营第一课<玩转用户标签体系,打造精细化运营底层能力>课程整理所得. 作者介绍 本次课程主要分为三部分内容: 用户标签画像的价值 如何构建可落地的用户 ...

  8. 标签体系、用户分群、用户画像「玩味」解读,你沦为形式主义了吗?

    数据一直是各行各业的核心资产,蕴含巨大价值待挖掘,在数据→信息→知识的转化过程中,标签.指标是基础,它将抽象的数据转化为一个相对具象的信息中心,用户分群和用户画像都是在建立在信息中心上的综合应用手段, ...

  9. 用户画像标签维度_一文看懂用户画像标签体系(包括维度、应用场景)

    一文看懂用户画像标签体系(包括维度.应用场景) 互联网相关企业在建立用户画像时一般除了基于用户维度(userid)建立一套用户标签体系外,还会基于用户使用设备维度(cookieid)建立相应的标签体系 ...

最新文章

  1. 为什么阿里程序猿纷纷在内网晒代码?
  2. linux centos 6.8svn,CentOS6.8 安装配置以SVNAdmin管理SVN代码库
  3. 数据库生存曲线_WGCNA、生存分析、ROC共同筛选biomarker
  4. 2022年美国大学生数学建模竞赛——Problem E:林业固碳
  5. 随机生成一个质数的python代码_使用质数生成随机密码
  6. ASP.NET Core 沉思录 - 结构化日志
  7. 硬件?软件?视频会议系统中两者有何区别?
  8. 程序员问答网站:StackOverflow
  9. 计算机视觉中的注意力机制的学习笔记
  10. 1996.游戏中的弱角色的数量
  11. AcWing 1934. 贝茜放慢脚步(二路归并)
  12. C++函数重载与引用的较好的练习实例
  13. Winrunner实验三 测试脚本编程(一)
  14. Windows 7 激活时提示“系统保留分区未分配驱动器号!”解决方法
  15. 官方发布 激情世界杯】浩海技术 GHOST XP SP3 世界杯装机特别版★用稳定压倒一切!...
  16. 为手机游戏而生的Linux 发行版
  17. 0516---win10 chrome 浏览器播放视频没有声音的解决办法
  18. 【技术贴】Pdf压缩利器--PDFshrink使用教程
  19. [原创] Python3.6+request+beautiful 半次元Top100 爬虫实战,将小姐姐的cos美图获得
  20. java.lang.NoSuchMethodError问题解决

热门文章

  1. linux wifi 源代码,MTK MT7601 WIFI AP linux driver source code - 源码下载|嵌入式/单片机编程|嵌入式Linux|源代码 - 源码中国...
  2. JavaScript核心基础总结笔记
  3. php日志,monolog - PHP 日志神器
  4. 车道检测(传统方法)
  5. UE4(虚幻4)基础:光照需要重建
  6. FFmpeg -- 解码视频
  7. 【Vivado那些事儿】Vivado环境一览
  8. 关于组装微型计算机的叙述不正确的是,计算机与交互式白板通过USB数据线物理连接后,还要正确安装(),这样才能正常使用。...
  9. Chrome 开发工具指南
  10. 【Javascript】求两个对象的交集、差集