引言

决策引擎服务是风控系统的大脑,承载着风控策略编排和计算的任务,对决策的时耗精度有着严格的要求,本文以决策流执行路径实现方案为切入点,一窥风控决策引擎高效的原理。

背景

在上文 风控决策引擎——决策流构建实战 中详细介绍了风控决策引擎的发展历程,决策流的编排能力,满足了策略运营人员对当前风险场景下的防控策略足够灵活高效的部署。

“灵活”往往意味着不可控,从多年的开发经验中来看,产品的功能在既定的范围内,基本不会出现不可控的问题(除非是 BUG)。像 SQL 查询语言,对数据分析人员来说非常的灵活,抽象的语法可以满足任何数据组装查询组装需求,但此时危机正在蔓延:随时可能出现一个慢查询导致性能问题!

**“灵活”和“高效”往往在程序内是互斥的,足够的灵活,往往是牺牲一定的效率得到的。**研发人员能做的,就是在两者中博弈,找到最佳平衡。

决策流执行演进

如下是策略运营人员配置的较常见的决策流图:

流程图看似简单,但是在实际执行程序执行过程中会遇到各种各样的问题和挑战,根因还是上下游业务对风控决策执行的耗时有严格的控制要求。

一代目——串行执行工作流

此阶段就像一个工作审批流,从开始节点一步一步的往下串行执行,直到终点。决策过程中,完全依赖节点路径的复杂度,假设一个节点的平均耗时为 100ms,那么如下红色执行路径需要耗时 500ms。

500ms 对风控来说是比较奢侈的,整个业务线一次请求耗时可能大半时间都被我们消耗掉了,这显然是不能接受的。可以想象,随着业务场景越来越复杂,策略人员对决策流的编排复杂度越来越高,导致整个决策流的决策路径越来越长,耗时呈线性增长,这种技术实现方案肯定是不能接受的。

总结:

  • 优点

    • 所见即所得,不会多执行也不会少执行
    • 串行执行对程序调试和日志友好,方便调试
  • 缺点
    • 性能极差,策略人员不能接受

二代目——并发执行工作流

活干不完,咱就堆人。同样的,一个线程干不完的,咱就堆线程并发计算。

本着空间换时间的思想,预先将决策流内的节点全部预加载完成,将结果缓存住,真正执行决策流的时候,请求缓存直接计算执行,大大节省了决策时间。

此时影响决策性能的卡点在最耗时的那个节点,只需集中人力解决掉这个节点的性能问题就能降低决策流执行时间了。

总结:

  • 优点

    • 性能一流,空间换时间,最大化的提效
  • 缺点
    • 算力很大,所有节点都并发请求,对下游系统的负载要求很高
    • 浪费巨大,当笔请求决策在节点 A 就被拒绝了,但是后续所有节点都计算了一遍,很浪费;又比如有些收费节点,提前调用了,但是并未使用,成本极大
    • 未考虑节点依赖问题,假设节点 C 依赖 节点 A 的结果,此处会导致并发加载节点 C 时没有相应的入参而出错

三代目——依赖分析&并行

方案二除了不考虑成本问题外,最大的痛点在于依赖关系问题,这是致命的。此时需要在运行时动态分析决策流节点之间的依赖关系

从图中可以看出,节点 C 依赖节点 A,节点 D 依赖节点 B,其它节点相互不依赖,那么此时可以通过依赖分析出节点与节点之间的分组关系,通过分组头结点先后顺序串行执行。

节点依赖分析

那么如何实现节点的依赖分析及先后执行顺序呢?
流程图本身可以就是一个 DAG(有向无环图),节点执行的先后顺序可以用 **BFS(广度优先遍历)**遍历出一维数组,然后遍历分析每个节点的入参和之前的节点的出参是否有关联,有关联的归并到之前节点组链表的“尾巴上”,否则即为不依赖,可并行执行。

此时整个决策流执行耗时情况如下:

决策流执行耗时 = 并行组1耗时 + 并行组2耗时 + ... + 并行组 N耗时

总结:

  • 优点

    • 解决了决策流中并行处理中前后依赖问题
    • 对策略人员的配置有一定的要求,需要尽量规避掉依赖关系,或者减少依赖分组
  • 缺点
    • 依然没有解决方案 2 的成本问题,每个节点还是加载了一遍,算力浪费严重

四代目——路径预测&动态剪枝

方案 2、3 都是全量并行加载各节点数据,对算力和成本的消耗是巨大的,实际在运行的过程中,公司在成本这块肯定是不能接受的,可能资损召回都不定能抵得上服务器和外部资源的开销。

通过分析决策流图,可以发现,分流节点的功能是排它,即决策数据流向只会选择一条路径执行,那么此时我们能在并行执行之前确认哪些路径在当次决策请求中不会经过,则可以排除掉不会经过路径上的节点,从而减少不必要的算力和成本。

排它网关剪枝如上图,优先找出排它网关节点 S1, S2,分析入参是否依赖上游节点,此时 S1 依赖节点 B,S2 无依赖,则可按照排它节点分组并发执行决策出排它路径,此时 S1 节点对应的节点 C 被“剪枝”,S2 节点对应的节点 G 被“剪枝”。

总结:

  • 优点

    • 算力最小化,只并发加载行进路径中的节点算力
  • 缺点
    • 行进路进中的节点未考虑成本问题,可能在前置节点已经拒绝,后直接点算力浪费

五代目——饿汉式&懒汉式

按照方案 4,已经解放了一大部分不会走到分支的算力,但是在正确的决策路径上,依然存在浪费,举例如上:

  • A 节点是名单节点,如果命中名单,直接通过或者拒绝,后续节点并行加载都是浪费的
  • 节点 D 和 节点 F 都是付费节点,并发调用,成本极高,可能在途中就被拒绝而未实际用到付费结果

此时,需要标识出付费节点(或者任何需要控制资源的节点),改为懒加载模式,即在前置并发加载所有节点时剔除懒加载节点,在决策流路径真正执行到该节点时再去计算,确保调用了一定是有效的,此时,构建节点时需要区分设置节点类型是饿汉式 or 懒汉式

总结:

  • 优点

    • 基本规避了上述方案涉及到的问题,在最大化利用率和性能之间取得平衡
  • 缺点
    • 决策流的编排需要通力合作,导致性能问题的点可能随着编排而山下浮动,需要异动监控机制

总结

本文梳理了决策引擎编排决策流过程中为了提高决策性能和节约成本上做出的一些列优化方案,针对不同的场景,可自由选择激进的方案 or 性能和成本兼顾的方案。

研发是站在产品规划的角度去思考实现方案的,脱离规划的设计再好,也不能真正的落地,谨记。

往期精彩

  • 从 0 到 1 智能风控决策引擎构建
  • 性能优化必备——火焰图
  • 我是怎么入行做风控的

欢迎关注公众号:咕咕鸡技术专栏
个人技术博客:https://jifuwei.github.io/

风控决策引擎——决策流路径规划相关推荐

  1. 风控决策引擎——决策流构建实战

    引言 本篇主要聚焦介绍风控决策引擎中决策树编排能力的构建.决策引擎是风控的大脑,而决策树的编排能力和体验是构建大脑的手段,如何构建高效.丝滑.稳定可靠的决策树编排能力,是对风控决策引擎的一大挑战,本篇 ...

  2. 金融科技大数据产品推荐:恒丰银行实时智能决策引擎

    恒丰银行实时智能决策引擎是恒丰银行业务策略管理解决方案的核心产品,该产品让策略业务人员轻松高效地配置出风控.反欺诈.实时营销等场景下实时.准实时的决策模型/规则 官网 | www.datayuan.c ...

  3. 决策引擎EngineX平台实践

    目录 1. 决策引擎介绍 什么是决策 什么是决策引擎 2. 应用场景 交易反欺诈应用场景 实时营销应用场景 信用反欺诈应用场景 3. 决策引擎调研 开源规则引擎 商业规则引擎 4. 决策引擎实战 决策 ...

  4. Fibo Rule决策引擎应用实践

    1. 决策引擎介绍 什么是决策 决策,指决定的策略或办法.是人们为各种事件出主意.做决定的过程.它是一个复杂的思维操作过程,是信息搜集.加工,最后作出判断.得出结论的过程. 什么是决策引擎 决策引擎是 ...

  5. a算法和a*算法的区别_机器人路径规划算法,全局路径规划与局部路径规划究竟有哪些区别?...

       若步智能                  移动这一简单动作,对于人类来说相当容易,但对机器人而言就变得极为复杂,说到机器人移动就不得不提到路径规划,路径规划是移动机器人导航最基本的环节,指的是 ...

  6. 自动驾驶路径规划概况

    文章目录 前言 介绍 1. 路径规划在自动驾驶系统架构中的位置 2. 全局路径规划的分类 2.1 基础图搜索算法 2.1.1 Dijkstra算法 2.1.2 双向搜索算法 2.1.3 Floyd算法 ...

  7. 自动驾驶路径规划——路径规划入门须知

    目录 前言 1.无人驾驶关键技术 2.路径规划基本概念与分类 2.1 路径规划基本概念 2.1.1 路径规划需要解决的问题 2.1.2 路径规划--现在的研究 2.2路径规划的分类 2.3路径规划的流 ...

  8. 智能风控平台核心之风控决策引擎(二)

    本文摘要:信贷风控策略建设思路.决策引擎主要功能 适用阅读人群:互金产品人员.互金模型人员.互金研发人员 在风控决策引擎(一)中,只是对风控决策引擎的核心功能规则.评分卡.模型.表达式.决策流等模块做 ...

  9. 风控策略和模型的区别_智能风控平台核心之风控决策引擎(二)

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 互金杂货铺(id:hjzahuopu) 作者 | 互金杂货铺 本文摘要:信贷风控策略建设思路 ...

最新文章

  1. Harbor: 跨数据中心复制Docker镜像的开源实现
  2. mysql主从读写Windows_Windows操作系统下的MySQL主从复制及读写分离
  3. java 自动封装_自动补全的java封装
  4. RWCString 定义 memeroy leak
  5. win8.1平板安装ubuntu16.04的折腾
  6. 计算机网络技术期末考试复习总结
  7. 风变编程python论文_如何看待风变编程的 Python 网课?
  8. 揭秘支撑双 11 买买买背后的硬核黑科技!
  9. mongoDB 3.0以前版本 - 入门指南、示例
  10. Linux 命令(86)—— head 命令
  11. opera pms 数据库 MySQL_2020年最新版Opera PMS常用报表总结
  12. 身份证前6位对应的省市区县
  13. python读取math_python调用通达信公式,python读取通达信公式结果
  14. 【毕业设计6】基于51单片机的红外避障小车
  15. 数据库系统——数据模型基本概念详解
  16. operands could not be broadcast together with shapes解决方案
  17. 服务器版系统里无线网卡如何打开,无线网卡被禁用了怎么开启
  18. Scrapy爬虫以及Scrapyd爬虫部署
  19. lol手游修改服务器,英雄联盟官方修改大区的方法
  20. virt-install命令详解

热门文章

  1. 暨王博士关于学术论文写作指导总结
  2. 电子计算机显示屏不亮了,手把手教你电脑显示器不亮怎么办
  3. 程序员,隐藏的段子手
  4. 教程篇(7.0) 08. FortiGate基础架构 诊断 ❀ Fortinet 网络安全专家 NSE 4
  5. 通配符(一般用来查找文件)
  6. 线上教学是计算机在什么方面的应用,浅谈线上线下混合式教学模式在计算机基础教学中应用...
  7. 【渝粤题库】陕西师范大学165210 国际人力资源管理 作业(专升本)
  8. 2021年初级会计职称《初级会计实务》考试真题
  9. centos7 虚拟机不识别U盘
  10. 公鸡5元每只,母鸡3元每只,小鸡3只1元,100元买一百只鸡多少种办法?