风控技术的发展,经历了传统的黑白名单、规则系统,各风控公司都在不断探索新的风控技术和手段。随着人工智能的发展,现在风控领域大量使用有监督机器学习方法,同时,有一些公司在探索和应用更高级别的无监督机器学习。

事实上,在有监督和无监督机器学习之间,还有一种半监督机器学习方法,也是慧安金科主打的风控方法,综合了有监督和无监督机器学习的优势,尤其在针对特定场景的风控方面效果非常显著。

银行金融风控场景为例,我们来了解一下半监督主动式机器学习的技术优势。

银行金融风控面临的主要业务场景包括欺诈交易检测、反洗钱、内控合规,等等。欺诈交易一般指第三方欺诈,也就是发生的交易并非持卡人本人意愿的交易,通常是不法分子利用各种渠道盗取了卡信息,伪卡作案。

洗钱指的是通过各种手段隐瞒非法收入的来源和性质,将它们合法化,目的是逃避法律的制裁。

银监会、人行、外汇组织等都会要求银行、出入境管理、证券等机构对大额、可疑的交易进行监控,并制定了严格的监控标准。但是,只要有标准就有规避的办法,不法分子会想方设法来反推存在的标准,设计新的手段来段绕开监管机构的反洗钱检测系统。

欺诈交易和洗钱活动在行为表现上变化莫测、难以捉摸,但是银行的风控系统却要在几十毫秒内做出是否拦截一笔交易的决定。这对银行的风控系统的准确性和即时性提出了很高的挑战,因为拒绝一个优质用户的正常交易将直接影响该用户对银行的信任。

为此,银行部署了相应的风控系统,但是面对不法分子越来越复杂且变化多端的攻击模式,银行风控系统往往疲于应对。比如,他们使用不同的地点、信用卡和设备来设计不同的规避手段,并进行不同金额的汇款来混淆视听。

针对这类活动,传统的风控方法是黑白名单和规则系统。当机器学习方法开始向风控领域渗透之后,在银行风控领域得到了广泛的应用。这些技术都在某些层面上解决了银行金融风控面临的问题,却仍然存在漏网和误伤的情况。

与这些方法相比,慧安金科的半监督主动式机器学习方法无论在成本控制、还是风控结果上都存在着一定的优势。

优势一:主动发现未知欺诈模式,提前预警

黑白名单是最简单直接的方法,当然误伤率也最高,因为很难划清楚黑白之间的那条线,而大多数用户实际上处在黑白之间的灰色地带。

规则系统是黑白名单的升级版,一般是通过业务经验以及对历史风险事件的总结形成的规则组合,需要根据业务成本、对风险的容忍度设置关键变量的阈值,只要符合其中一项就算命中。当新的欺诈交易或洗钱行为发生时,就会增加一条新的规则或者根据具体情况修改阈值。

由于传统的黑白名单和规则系统都对经验有很高的依赖性,不但无法覆盖全部用户事件,而且精细度不足,在银行反洗钱场景中的误报率很高。根据普华永道提供的数据,反洗钱检测输出的所有警报中有90%~95%都是误报。

同时,黑白名单需要根据历史数据去清洗,规则系统需要大量的专家根据历史案例去生成,它们的时效性和维护成本都会很高,而且难以防范狡猾多变、不断变化手段的欺诈/洗钱分子。因此,银行现有的反洗钱风控系统需要花费大量的人力调查警报事件、优化风控系统,费时费力,且效果不佳。

慧安金科的半监督主动式机器学习技术能够主动地发现新的可疑行为,从而实现主动识别和提前预警的目的。通过实时地获取用户的行为数据和环境数据进行分析,它可以主动地识别用户行为和关联的异常,有效地在不法分子实施攻击之前识别可疑行为,主动报警,提醒客户风控人员加强对这些可疑人群的关注和防范。

此外,它将人工智能模型与专家系统有机融合,当把检测结果输出给客户风控专家之后,收集客户风控专家的反馈意见,并将客户主动打上的强标签添加到模型中,让模型主动地学习,不断优化升级,防范那些变化多端、想方设法规避检测的不法分子。

优势二:仅采用少量的历史标签,迁移扩散

有监督机器学习可以利用多维数据建立复杂的规则模型。对于银行风控场景来说,根据欺诈交易或者洗钱活动发生的概率给规则系统里的每一条规则加上一个权重,再将规则转化为可以计算的数值,通过计算得到此类事件发生的概率。计算权重的过程,就是模型训练和学习的过程,也是模型不断优化的过程。

用来训练模型的,就是标签样本。由于采用少量标签建模的检测结果常常不准确,有监督机器学习通常使用大量的标签样本来训练模型,并在此基础上预测新的样本。

然而,标签并不容易获得,而且获取标签的成本太高,因为每一个标签都代表着已经发生过的攻击活动,每一个标签都是血淋淋的代价。而且标签往往只代表历史,代表过去发生的欺诈活动,当欺诈分子使用新的手段,依赖过去的标签数据训练出来的模型很难抓到它们。

标签太少,模型就不够准确,增加标签,又会显著增加风控成本。因此,对于有监督机器学习而言,可用标签数量的多少其实是控制风控成本和提高风控效率之间的博弈。

慧安金科的半监督主动式机器学习技术的核心思想是利用有限的标签建立高质量的模型。它使用非常少的标签样本和大量没有标签的样本进行建模分析,再将标签迁移、扩散到更多没有标签的样本上,获得更多准确的标签,从而可以在攻击行为发生之前快速识别潜在的欺诈分子。

同时结合专家经验将新的攻击模式以可视化的方式展现出来,提供给客户的风控专家,并将客户风控专家反馈回来的强标签注入机器学习模型,让模型不断学习,提高识别风险的准确率。

优势三:检测结果可视、可解释,参考度高

慧安金科的半监督主动式机器学习技术,基于每个用户的行为数据和环境数据建立模型,在分类和聚类算法的基础上,融合机器学习、异常检测、图分析等技术来搭建了一套企业级人工智能决策引擎。

这个决策引擎可以实时监测客户平台上的用户行为,并将最终的检测结果通过一套非常完善的数据可视化系统提供给客户,客户可以看到用户分布、行为分布,可以看到欺诈分子的风险高低和行为特点,甚至可以看到我们确定欺诈分子的决策路径。

基于这样的可视化系统,可以实现检测结果的可解释,从而为客户风控人员进行决策提供依据,方便他们对高危用户进行更好的管控。

“这是最好的时代,也是最坏的时代。”互联网向各行各业的渗透是一把双刃剑,对于银行而言,金融业务的互联网化一方面降低了经营成本、获客成本,同时提高了运营的效率,另一方面也为不法分子的攻击活动提供了便利。

与不法分子之间的较量,是技术水平与创新能力的角力,也是银行风险管控与盈利创收之间的博弈。风控之路,道阻且长。在与不法分子的长期拉锯战中,技术创新是永恒的主题。

选择了半监督主动式机器学习,意味着慧安金科已经在智能风控领域走在了前列。在未来与不法分子的对抗中,慧安金科将继续以半监督主动式机器学习技术为根本,不断创新,构建更为完善的一站式风控模型,为银行以及金融机构提供以应用场景为导向的人工智能决策引擎服务,帮助客户主动地应对日益变化的风险环境、自动地响应新的威胁和攻击,为客户提供全方位的智能检测与防护策略。


相关文章:

基于个人信用评分的建模分析和授信决策

金融风控:通过率与坏账率的博弈

数字金融反欺诈技术名词表

数字金融欺诈行为名词表

半监督主动式机器学习的技术优势:银行金融风控场景分析相关推荐

  1. 概述:机器学习和大数据技术在信贷风控场景中的应用

    来源:知乎 本文约5400字,建议阅读10分钟 本文简要概述在当前大数据和机器学习技术如何在信贷风控场景下的常见应用. 似乎一夜之间,所有的互联网公司在对外的宣传稿中都会提及自己使用机器学习和大数据技 ...

  2. 机器学习——监督学习、非监督学习、半监督式学习、增强学习

    机器学习的主要问题 supervised learing:监督学习 unsupervised learing:非监督学习 discrete:离散的 continuous:连续的 classificat ...

  3. 机器学习教程 之 半监督学习 基于图正则项的半监督极限学习机

    半监督学习是指在模型训练阶段同时利用有标签数据和无标签数据.我之前介绍过的半监督学习方法包括 基于分歧的半监督学习方法 机器学习教程 之 半监督学习 Tri-training方法 (论文.数据集.代码 ...

  4. 半监督学习matlab,基于自适应图的半监督学习方法与流程

    本发明属计算机视觉.图形处理 技术领域: ,具体涉及一种基于自适应图的半监督学习方法. 背景技术: :随着计算机网络技术的快速发展和人们对数据访问的多样化,人们可以获得的信息呈指数级别增长,如何利用这 ...

  5. 10亿级数据规模的半监督图像分类模型,Imagenet测试精度高达81.2% | 技术头条...

    译者 | linstancy 作者| I. Zeki Yanlniz, Herve Jegou, Kan Chen, Manohar Paluri, Dhruv Mahajan 编辑 | 蓝色琥珀鱼, ...

  6. 【机器学习基础】半监督算法概览(Python)

    前言 前阶段时间梳理了机器学习开发实战的系列文章: 1.Python机器学习入门指南(全) 2.Python数据分析指南(全) 3.一文归纳Ai数据增强之法 4.一文归纳Python特征生成方法(全) ...

  7. 西瓜书+实战+吴恩达机器学习(十六)半监督学习(半监督SVM、半监督k-means、协同训练算法)

    文章目录 0. 前言 1. 半监督SVM 2. 半监督k-means 2.1. 约束k-means 2.2. 约束种子k-means 3. 协同训练算法 如果这篇文章对你有一点小小的帮助,请给个关注, ...

  8. 【机器学习】有监督、无监督、自监督、半监督、弱监督的区别

    有监督:用有标签的数据训练: 无监督:用无标签的数据训练: K-means等 半监督:利用数据分布上的模型假设建立学习器对未标签样例进行标签.通常是两阶段的训练,先用(较小规模的)有标签数据训练一个T ...

  9. 图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :专知 AI博士笔记系列推荐 ...

最新文章

  1. MyEclipse Derby数据库服务器使用方法
  2. phoenix hbase Can't get master address from ZooKeeper; znode data == null
  3. RabbitMQ之监控(3)
  4. leetcode403 青蛙过河
  5. RabbitMQ的5种队列_路由模式_入门试炼_第8篇
  6. 计算机论文答辩2分钟演讲稿,毕业答辩发言稿三分钟
  7. Pytest标记用例失败之xfail
  8. mysql查询索引位置_mysql索引在什么位置
  9. noip2019集训测试赛(七)
  10. Excel批量打开URL
  11. 计算机毕业论文选题管理系统的设计与实现
  12. 回顾+纪念:离开帝都的第一年
  13. css从中间向两边动画,css动画效果:鼠标移上去底部线条从中间往两边延伸 - 子成君-分享出去,快乐加倍!-旧版已停更...
  14. 启动界面、封面图片、Splash关不掉,一直转圈,无法进入
  15. 双月报8.24-10.23
  16. 天勤python_天勤量化策略库:R-Breaker策略(难度:初级)
  17. 拼多多校招内推编程题3 六一儿童节
  18. 关于计算优惠券金额的部分优化
  19. MATLAB08:符号运算
  20. Flink检查点失败问题-汇总

热门文章

  1. 前端开源项目周报0214
  2. UVA 11054 Wine trading in Gergovia
  3. Android学习笔记09:Paint及Canvas的简单应用
  4. php 生日提醒程序
  5. linux bash profile bash_profile 小结
  6. 调用android自带的下载功能,进度在消息通知栏上显示
  7. discuz上传附件失败问题解决办法
  8. java interface_Java中的接口(interface)
  9. jq php上传图片插件,ajaxImageUpload
  10. ImportError: cannot import name ‘Optional‘