反欺诈是风控中非常重要的环节,也是知识图谱适合应用的场景。而知识图谱用来描述关系网络,天生是分析关联欺诈的便捷手段。以先进的团伙识别算法为基础,目前越来越多的机构构建了全新的团伙欺诈识别模型,在实际业务中识别准确率可达70%+以上。
除了反欺诈之外,图谱还可以cover哪些传统风控策略,无法cover到的场景呢?请看:

1.反欺诈
反欺诈是图谱中应用最广的场景,是风控中非常重要的一道环节。基于大数据的反欺诈的难点在于如何把不同来源的数据(结构化,非结构)整合在一起,并构建反欺诈引擎,从而有效地识别出欺诈案件(比如身份造假,团体欺诈,代办包装等)。而且不少欺诈案件会涉及到复杂的关系网络,这也给欺诈审核带来了新的挑战。
知识图谱,作为关系的直接表示方式,可以很好地解决这两个问题。首先,知识图谱提供非常便捷的方式来添加新的数据源,这一点在前面提到过。其次,知识图谱本身就是用来表示关系的,这种直观的表示方法可以帮助我们更有效地分析复杂关系中存在的特定的潜在风险。
反欺诈的核心是人,首先需要把与借款人相关的所有的数据源打通,并构建包含多数据源的知识图谱,从而整合成为一台机器可以理解的结构化的知识。在这里,我们不仅可以整合借款人的基本信息(比如申请时填写的信息),还可以把借款人的消费记录、行为记录、网上的浏览记录等整合到整个知识图谱里,从而进行分析和预测。这里的一个难点是很多的数据都是从网络上获取的非结构化数据,需要利用机器学习、自然语言处理技术把这些数据变成结构化的数据。

2.不一致性验证
不一致性验证可以用来判断一个借款人的欺诈风险,这个跟交叉验证类似。比如借款人张三和借款人李四填写的是同一个公司电话,但张三填写的公司和李四填写的公司完全不一样,这就成了一个风险点,需要审核人员格外的注意。
再比如,借款人说跟张三是朋友关系,跟李四是父子关系。当我们试图把借款人的信息添加到知识图谱里的时候,“一致性验证”引擎会触发。引擎首先会去读取张三和李四的关系,从而去验证这个“三角关系”是否正确。很显然,朋友的朋友不是父子关系,所以存在着明显的不一致性。
不一致性验证涉及到知识的推理。通俗地讲,知识的推理可以理解成“链接预测”,也就是从已有的关系图谱里推导出新的关系或链接。比如在上面的例子,假设张三和李四是朋友关系,而且张三和借款人也是朋友关系,那我们可以推理出借款人和李四也是朋友关系。

3.组团欺诈
相比虚假身份的识别,组团欺诈的挖掘难度更大。这种组织在非常复杂的关系网络里隐藏着,不容易被发现。当我们只有把其中隐含的关系网络梳理清楚,才有可能去分析并发现其中潜在的风险。知识图谱,作为天然的关系网络的分析工具,可以帮助我们更容易地去识别这种潜在的风险。
举一个简单的例子,有些组团欺诈的成员会用虚假的身份去申请贷款,但部分信息是共享的。下面的图大概说明了这种情形。从图中可以看出张三、李四和王五之间没有直接的关系,但通过关系网络我们很容易看出这三者之间都共享着某一部分信息,这就让我们马上联想到欺诈风险。虽然组团欺诈的形式众多,但有一点值得肯定的是知识图谱一定会比其他任何的工具提供更加便捷的分析手段。

4.异常分析(AnomalyDetection)
异常分析是数据挖掘研究领域里比较重要的课题。我们可以把它简单理解成从给定的数据中找出“异常”点。在我们的应用中,这些”异常“点可能会关联到欺诈。既然知识图谱可以看做是一个图(Graph),知识图谱的异常分析也大都是基于图的结构。由于知识图谱里的实体类型、关系类型不同,异常分析也需要把这些额外的信息考虑进去。大多数基于图的异常分析的计算量比较大,可以选择做离线计算。在我们的应用框架中,可以把异常分析分为两大类:静态分析和动态分析,后面会逐一讲到。

a)失联客户管理
除了贷前的风险控制,知识图谱也可以在贷后发挥其强大的作用。比如在贷后失联客户管理的问题上,知识图谱可以帮助我们挖掘出更多潜在的新的联系人,从而提高催收的成功率。
现实中,不少借款人在借款成功后出现不还款现象,而且玩“捉迷藏”,联系不上本人。即便试图去联系借款人曾经提供过的其他联系人,但还是没有办法联系到本人。这就进入了所谓的“失联”状态,使得催收人员也无从下手。那接下来的问题是,在失联的情况下,我们有没有办法去挖掘跟借款人有关系的新的联系人?而且这部分人群并没有以关联联系人的身份出现在我们的知识图谱里。
如果我们能够挖掘出更多潜在的新的联系人,就会大大地提高催收成功率。举个例子,在下面的关系图中,借款人跟李四有直接的关系,但我们却联系不上李四。那有没有可能通过2度关系的分析,预测并判断哪些李四的联系人可能会认识借款人。这就涉及到图谱结构的分析。

b)智能搜索及可视化展示
基于知识图谱,我们也可以提供智能搜索和数据可视化的服务。智能搜索的功能类似于知识图谱在Google,Baidu上的应用。也就是说,对于每一个搜索的关键词,我们可以通过知识图谱来返回更丰富,更全面的信息。比如搜索一个人的身份证号,我们的智能搜索引擎可以返回与这个人相关的所有历史借款记录、联系人信息、行为特征和每一个实体的标签(比如黑名单,同业等)。另外,可视化的好处不言而喻,通过可视化把复杂的信息以非常直观的方式呈现出来,使得我们对隐藏信息的来龙去脉一目了然。

c)精准营销
一个聪明的企业可以比它的竞争对手以更为有效的方式去挖掘其潜在的客户。在互联网时代,营销手段多种多样,但不管有多少种方式,都离不开一个核心-分析用户和理解用户。知识图谱可以结合多种数据源去分析实体之间的关系,从而对用户的行为有更好的理解。比如一个公司的市场经理用知识图谱来分析用户之间的关系,去发现一个组织的共同喜好,从而可以有针对性的对某一类人群制定营销策略。只有我们能更好的、更深入的(Deepunderstanding)理解用户的需求,我们才能更好地去做营销。

详细可关注“关系网络实操专题课”,会重点介绍关系网络:
1.特征提取
#联系一度联系人的人均二度逾期会员个数
#联系一度联系人的人均二度黑名单会员个数
##同商户同手机归属地客户数
#同商户同手机归属地黑名单客户数
#同商户同手机归属地逾期客户数

2.社交网络模型的建模与分析
3.贷中反欺诈的应用
4.风控闭环——标签回馈
5.关系网络深度拓展——二度三度四度关系网的运用
6.解决关系图谱中,用起来越来越慢,相关的提速方案有哪些?
7.计算图指标中的密数,密度?
8.如何结合python中应用场景,计算图指标做建模特征?

将以理论+实操案例的角度,为各位童鞋深度剖析关系网络实操落地。

~原创文章

~end

what?传统风控策略,无法cover到以下风控场景相关推荐

  1. 全面了解风控策略体系

    模型和策略的开发是一个系统工程,这其中需要有业务经验.统计理论.算法运用.和数据认知,是一个不断反思,不断积累经验的过程.沙滩上建不起摩天大楼.扎扎实实的基本功永远有价值,永远不会过时. --余旭鑫博 ...

  2. 实战篇|风控策略效率的测试、调优与评估

    信贷风控策略调优包括通过率调优.逾期率调优,这些做过策略的童鞋肯定都清楚.风控策略的内容,番茄风控之前的内容可谓是丰富.齐全,具体可翻看之前的内容: ①贷前决策部署与策略调优(全) ②一文了解下调优后 ...

  3. 风控策略的开发与场景应用

    近期一段时间,番茄风控给大家分享了两次关于策略探索与开发的主题课程,干货满满,精华尽出,番茄课堂分别对应: 第78次课<信贷场景多维特征交叉策略的实战分析> 第79次课<信贷风控策略 ...

  4. 风控策略和模型的区别_风控策略

    风控策略 第一类,利用多元化的投资工具对冲. 使用的工具有可转债.企业债.封闭式基金.股指期货.融券卖空.杠杆.程序化交易等. 代表私募有崔军旗下的一其创赢产品和梁跃军旗下的朱雀阿尔法 1 号,重阳投 ...

  5. 【科技金融】CART树现金贷风控策略

      对数据分析.机器学习.数据科学.金融风控等感兴趣的小伙伴,需要数据集.代码.行业报告等各类学习资料,可添加微信:wu805686220(记得要备注喔!),也可关注微信公众号:风控圏子(别打错字,是 ...

  6. 【风控策略】大数据风控策略逻辑

    从现金贷平台方面来看,一是完善大数据体系和风控模型,放款给那些急需用钱的人,需要快速判断用户画像,需要很强的大数据和风控模型来做支撑.二是准确评估用户属性,产品定价回归理性.筛选出相对优质的客户群体, ...

  7. 【采用】【科技金融】CART树现金贷风控策略

    考虑到用户下沉严重.流量成本高等问题,为保证成本和收益的balance,就要合理控制loan%和bad%之间的balance.因此,现金贷产品的风控策略有别于消金.电商等,不能一味的拒绝,而要合理有序 ...

  8. 风控策略和模型的区别_风控模型之产品赢利分析与策略优化

    欢迎加入全国风控微信群组:免费加入,详情可添加管理Vivian:wmyd80回复微信群组 之前我们说过,产品上线后并不是一成不变的,而是需要后续赢利分析数据表现不断调整,其风控模型策略也是不断优化的. ...

  9. 风控策略和模型的区别_智能风控平台核心之风控决策引擎(二)

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 互金杂货铺(id:hjzahuopu) 作者 | 互金杂货铺 本文摘要:信贷风控策略建设思路 ...

最新文章

  1. ubuntu常用小工具
  2. hibernate_day03_一对多相关操作
  3. Using dbms_shared_pool.purge to remove a single task from the library cache
  4. centos 开机执行的命令
  5. 互联网晚报 | 1月16日 星期日 | 微信新增语音播放暂停功能;小米MIUI“纯净模式”上线;全国首例“刷单案”宣判...
  6. VS2010 Cocos2d-x 2.2创建模板
  7. 【博客话题】接触Linux 11年
  8. LeetCode - 709. To Lower Case
  9. (22)Spring Boot 拦截器HandlerInterceptor【从零开始学Spring Boot】
  10. 重新审视SqlDataReader的使用
  11. Java帮助文档的生成
  12. 【听说有人想转码】入门----凯撒密码(密文解密,偏移)
  13. Linux——虚拟机系统安装
  14. java fckeditor下载,Fckeditor与Java web 整合代码
  15. 猿人学爬虫攻防大赛 | 第五题: js混淆 乱码增强
  16. 50道C/C++编程练习题 复习必备(1-10)
  17. 建立数据驱动,关键字驱动和混合Selenium框架这些你了解吗
  18. 查SCI索引号和EI索引号的方法
  19. ubuntu18.04 升级内核后,进入系统页面卡在“started gnome display manager“的解决方案
  20. 利用WiFi控制手机进行刷宝APP看视频

热门文章

  1. linux c程序面试题,嵌入式linux面试题解析(二)——C语言部分一
  2. hyper运算符_25个特殊操作符(special operator)
  3. delphi 解析一维条码_科普帖:一般商用条码扫描器全知道,只需三把枪
  4. java多线程异步调用别的系统接口代码_60 多个实例讲解,彻底搞懂 Java 多线程!
  5. python 数据驱动接口自动化框架_利用Python如何实现数据驱动的接口自动化测试...
  6. fetch jsonp连接mysql_fetch跨域浏览器请求头待研究
  7. 抑制过拟合的方法之权值衰减
  8. Python轻量级WEB框架web.py,模板使用
  9. 为你的 Swift Packages 命名
  10. .net 中应用 ValidationAttribute