人工智能、区块链、容器技术等新兴技术的快速演进和发展,正在不断地推进企业数字化变革。8月10日,由上海市经济和信息化委员会、上海市国有资产监督管理委员会指导,上海市国有资产信息中心、上海市计算机用户协会协办,畅享网主办的“颠覆·创新 IT决胜未来——第二届创新技术CIO高峰论坛”在上海掀起了一股关于探讨创新技术发展和实践的热潮。百余位CIO、IT专家、学者们莅临本次峰会,大会上午探索创新技术发展,下午分享创新技术实践,参会嘉宾重新思考“新技术”的落地路径,共同寻找企业信息化变革的新机遇,打造企业最佳IT应用实践。

会上,上海浦东发展银行总行信息科技部大数据专家陈春宝为我们分享了《大数据与机器学习重塑零售银行业务》,以下为演讲实录,畅享网整理。

各位领导,各位同仁,大家上午好!很感谢主办方给我们这么好的时间,大家可以一边回味上午讲的内容,一边听我聊一聊大数据在银行业的应用。首先先做我行的介绍:浦发银行是一家上市银行,关于浦发银行的信息大家可以在网上搜索,我主要是说明两点。第一点是我们浦发银行名字叫上海浦东发展银行,但我们全国、全球的业务都做,我们在国内30个省市自治区设有40家分行,在新加坡、香港开设了分行,在伦敦设有代表处,未来我们会覆盖更多的国家;第二点我们是一家以稳健著称的银行,买过浦发银行股票的会有体会(开个玩笑)。

今天我主要分享四部分,第一:总结一下在零售银行业务中,大数据正在重塑的15个应用场景。第二:数字化银行的3个关键技术。第三:我行五个比较有代表性的实践案例。最后介绍一下我们近期规划的五个重点任务。

大数据正在重塑的15个零售业务场景

按照客户生命周期管理曲线,把大数据在零售业务的主要应用归纳为15个场景。第一个在客户获取阶段,有三个场景,首先是获客引流,例如外部合作、各类引流模型。现在是共享经济的时代,每个客户都是独一无二的,但是客户的需求是多元化的,各家公司共同合作可以更好的经营客户,服务客户,这是大势所趋。金融领域非常重要的一个场景是反欺诈,尤其是申请阶段,在这一阶段我们要筑起第一道防火墙,把坏人拦截在外面。互联网金融蓬勃发展,离不开先进的风控模型,其中银行的风险评分卡模型被广泛认可。第一个风控模型是申请评分卡,以及相关的信用评分,这两块主要工作是把坏人拦截在门外。最近很多银行在与厂商一起做反欺诈,主要有四种技术手段,黑名单、规则、评分模型、关系网络。前三个目前在成熟应用,关系网络是未来的发展方向。我们在14年的时候,研发了一个社交网络算法,获得了人民银行的科技发展二等奖,未来关系网络产品化并在反欺诈领域定会发挥更大的价值。

客户提升阶段也是三个场景,客户进来,怎么样让客户活跃起来,是这个阶段要做的事前。第一个场景是精准营销,这也是最成熟的一个领域。精准营销的六大要素,怎么样更精准的把握,非常重要,也就是说在客户拓展进来之后,怎么样让客户为我们产生价值,我们也要为客户带来价值,做到共赢。第三个就是行为评分模型,狭义上指风控领域的行为评分卡,广义上讲金融领域的很多评分模型都可称为行为评分模型。

第三个阶段到了客户成熟阶段,这个阶段怎么样更长久一点,是一个很有挑战性的课题。客户维系分为主动的客户维系和被动的客户维系。被动的客户维系是让客户持有更多的产品,提高客户离开的机会成本。主动的客户维系就是做客户细分,对客群不断的细分,发现每个客群的需求,加载产品,提供服务。什么是产品?什么是服务?有人说有形的是产品,无形的服务。我的理解是,如果我们推荐的产品不是客户需要的,就是销售产品,如果正是客户需要的那就变成了提供服务。第三个场景是欺诈侦测,交易阶段的反欺诈。坏人已经进来了,怎么样在交易阶段及时发现以便尽早采取措施,可以减少损失。

第四阶段是客户衰退阶段,人有生老病死,对于大部分客户来说也会面临着衰退、离开,我们怎么样提前预判老客户即将发生的离开、逾期、损失,提前做准备。这是预测损失发生的概率,第二个场景是预测损失发生的规模,风险一旦发生,危害有多大,测算风险敞口。第三是催收评分模型。当坏账已经形成,哪些我们自己回收、哪些交给催收公司催收,准确判断也可以尽量减少损失。

第五阶段是客户挽留阶段,目前也是设置了整个客户生命周期管理的流程。对于高价值的客户我们会提供更优质的服务,尽可能的防止或者延缓这个阶段的到来。

数字化银行的3个关键技术

接下来介绍这些业务场景背后的三个支撑技术。上午来的时候,同事说我现在再讲大数据太out了,别人都讲人工智能了。我想说AI和大数据不是替代关系,是不同的发展阶段。大数据,意味着更多数据,更多可能,我们怎么样全面认识一个客户,依靠更多的数据。我举个例子:芝麻信用分的征信评分,这个分数来自于哪里?来自于整个阿里庞大的数据板图。阿里这几年在经营一个庞大的产业帝国,背后则是一个数据帝国,每一次扩张都为自己的数据拼图增加几块。现在很多人感觉大数据有点过时了,实际上是因为大数据已经变成我们经营当中必不可少的内容,未来大数据很有可能像水电煤一样,我们拧开龙头随之即来,当然恐怕只有政府有能力做这个事情,除了要有能力汇集、输送全社会的数据,还要有足够的公信力。我们也在持续积累大数据,建立银行版的用户标签体系,按照业务的层面做了多种划分,同时每个标签我们也要按照它的事实层、模型层、预测层做深加工,这个标签体系未来还会不断的往外扩展。

第二是机器学习,数据本身并没有价值,也不会产生价值,除非你把数据卖掉。怎么样从数据当中获取知识?需要机器学习。什么是机器学习?我们每个人都是在不断学习,通过看书、参加论坛获得知识。今天大家参加论坛,感觉没学到东西,下次就不来了。如果觉得今天讲的不错,可能会关注主办方畅享网的官网,也可能到百度搜索一下嘉宾,学习嘉宾以前分享的知识,这是我们人类的学习。机器学习模式是一样的。我讲一个自己的故事,在座的很多都拍过沪牌,很难拍,我第一次拍的时候直接就冲进去看了一些规则,要在45秒的时候出价,我确实在45秒出价了,等到网页打开,手忙脚乱输验证码出错了;第二次又是45秒出价,验证码没打开;第三次我提前5秒钟出价,靠的是我对价格的准确预测,一次就中了,因为我多了5秒的时间足够后面的操作。机器学习有很多算法,包括人工智能里面有一些算法也是机器学习领域的。目前我们在用的这么多算法,我归纳为这么6类、二十几个,其中神经网络,尤其是深度学习,大家通常会把它称为人工智能算法。

第三个是移动互联网,大数据和机器学习强化了我们的大脑,但是为什么这几年,在很多领域产生的实际价值低于预期?原因就在执行力不够。现在人工智能要解决的不仅是思考端,更主要的是执行端。我们也有经营的缺陷,以前我们经营局限在中间的小圈里面,我们有什么金融产品,老是在这个小圈里做文章。最近两年在往外拓展,未来怎么样把我们的金融服务融合到实体产业、大众居民的日常生活当中去,是我们要发展的一个趋势。举个例子,大家去医院看病,可能花两个小时排队,医生看病花了5分钟,再去花半个小时排队付费,再回来看病。如果说医院跟银行合作研发一个便利看病新的业务模式,未来很有可能变成你去医院只要看病就可以了,中间不需要排队、付费,银行帮你结算,通过移动互联网这个愿景并不遥远。这三个技术加起来促成人工智能的应用,人工智能如要真正发挥价值,其三个最主要的支撑就是大数据、机器学习和移动互联网,像人一样的学习、思考、执行。

浦发银行数字化实践的5个典型案例

目前人工智能的应有很多,上午介绍的语音识别、智能机器人等等。我介绍一下这几年我们五个最经典的案例。阿里有芝麻信用,我们也有浦发的信用分,我们自己开发评分的算法,对每个客户打上信用分,运用到我们很多场景当中。其中有一个消费信贷,由于银行对风控管的很严,因为要对客户的资产负责,所以我们之前审贷是很严格的,很多客户到了审批环节就被拒掉了,我们用了这个模型之后,把风控前置到营销环节,提前发现一些明显评分偏低的、有信用缺陷的客户,在营销的时候过滤掉这些客户,可以节省营销资源、改善客户体验,目前这款网贷产品的营销拒贷率降为原来的一半,这是信用分的作用。这个模型与网贷平台去年获得了人行科技发展二等奖。

第二我们在做手机银行的“猜你喜欢”。网上我们买东西的时候经常会跳出来一些推荐,这个技术已经很成熟,这一块我们起步相对晚一点,目前也开始做。我们有很多金融产品,针对每个客户,计算对不同产品的喜好度,在手机银行上给每个人展示他最喜欢的、最感兴趣的产品,提升用户的活跃度和使用体验。

第三是最成熟的精准营销,精准营销最主要的一个变化,就是由原来的单次、大批量客户的营销模式,变成目前的高频次、每一次小批量的客户营销。我举几个代表性的营销案例,比如我们有爱客计划,通过模型识别客户的潜在需求,推荐感兴趣的产品和服务,我们的成功率接近10%。不用模型,用传统的方式则非常低。像商旅套餐,结合内外部数据构建模型并开展营销,对每一个数据标签做价值评估,作为外部数据合作和采购的依据。

第四是平衡风控和营销,我们推出了一个分分钟放款的信贷产品。依据经验做营销,营销响应率不足2%。我们通过三个模型,一个是营销模型,识别客户的需求,一个是信用模型,还有一个违约评分模型,通过这三套模型达到营销成功率接近10%,审批通过率超过50%,最终落地成功率相比传统模式提升了20倍。

第五是为各个业务场景做客户画像,辅助决策。我们说大数据,对应着大量的标签。当遇到一个问题的时候,究竟应该用哪一个标签?针对成千上万个客户标签,利用我们自己研发的特征识别算法,最快几分钟就能算出结果,给每一个场景画客户的脸谱。比如三个月内哪些客户有过存取款、半个月内谁在做跨行转帐等等。

近期规划的五个主要任务

最后我介绍一下近期规划。我们的目标是让业务更智能、更自动,更便捷。第一我们正在构建全域数据的地图,当数据过多的时候,使用数据的人会面临一个困惑,我要的数据在哪里?哪一个才是我真正想要的数据?这些数据之间有什么关系?这个属于数据治理范畴,但却是大数据分析和应用的基础。

第二是数据VTM,自助式取数下单。联想集团的单总说了一句话我很认同,技术发展很重要,但更重要的是要融入业务,促进业务发展。我们数据要用到业务里面去,目前传统企业,我相信大部分企业都是IT是一波人,业务是一波人,当业务需要数据的时候提个需求,让IT人帮忙取,但是有时候会有问题。比如昨天晚上我们有业务的同事急需一批数据,我们的人员又在忙于其他更重要的事前,业务人员只好自己来写代码,这其实也挺好的。因为业务人员掌握一定的技术,有助于他提出更合理的数据需求。当然我们也在向业务靠拢,会要求技术人员参与到业务中去,另外我们也在积极研发更多数据产品,便利业务人员更方便、容易的取到数据。例如我刚刚说的用户脸谱,如果给客户经理一个界面,他可以根据算法甄选出来的特征标签自己去定制、筛选客户清单,自助获取数据去开展业务。

第三我们要运用多渠道、自动化的推送机器学习结论,把有意义的数据挖掘结论固化下来,定期生成并推送到决策者、执行者的手机中去,让分析报告“活”起来。

第四智能化计算和建模,服务于移动互联网终端。传统的IT模型建好之后需要开发、变更,周期很长。急需更敏捷的投产方式,上午建成的模型,下午就能部署、应用,与传统方式两条腿走路,最终的目的是为执行端提供更好的决策支持。

第五AI业务架构再造。

通过这张图,把我刚才介绍的都串起来,包括数据、算法、工具、产品等,促进业务更智能、自动、便捷的开展。

最后如果大家对我介绍的内容感兴趣,欢迎参阅《大数据与机器学习:实践方法与行业案例》这本书,谢谢各位。

本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

上海浦发银行总行信息科技部大数据专家陈春宝:大数据与机器学习重塑零售银行业务...相关推荐

  1. phpstrom查看代码总行数_歪特内推浦发银行总行信息科技部

    WHITer内推--每天9点发布武汉优质互联网企业最新岗位内推机会.内推微信号:whxiaowai  内推邮箱:770554595@qq.com 浦发银行总行信息科技部武汉开发中心 简历筛选流程较慢, ...

  2. 学习大数据,大数据专家写给大数据分析学习者的10个理由

    由于大数据爆发,是以出现了大数据开发.大数据分析这两大主流的工作标的目的,今朝这两个标的目的是很热点,不少人已经在起头转型往这两个标的目的生长,相较而言,转向大数据分析的人才更多一点,而同时也有不少人 ...

  3. 为什么学习大数据,大数据专家写给大数据分析学习者的10个理由

    因为大数据爆发,因此出现了大数据开发.大数据分析这两大主流的工作方向,目前这两个方向是很热门,不少人已经在开始转型往这两个方向发展,相较而言,转向大数据分析的人才更多一点,而同时也有不少人在观望中,这 ...

  4. 渤海银行总行信息科技部2020春季校园招聘面试总结

    我的专业是计算机科学与技术,通过渤海银行总行信息科技部的笔试后,收到了面试通知. 因为疫情的愿意,用的是钉钉线上面试.所有的应聘者拉在一个群里.非回答者闭麦闭摄像头. 首先是依次自我介绍.没想到第一个 ...

  5. 十大项目告诉你:室内定位将是重塑零售世界的下一场革命

    室内定位是重塑零售世界的下一场革命. 无论是欧司朗,飞利浦,GE还是Zumtobel,照明世界的所有主要参与者都在开发自己的内部导航系统,利用种植在灯光或可见光通信(VLC)上的蓝牙芯片向购物者的智能 ...

  6. 中信银行总行信息科技部笔试面试以及最后拿offer经历

    中信银行 提交简历 19年的招聘网站十分垃圾,提交只能用IE,感觉今年的招聘官网十分不错(ps:开发招聘官网的团队刚好去实习过一段时间,氛围不错,想了解的,可以介绍下的) 笔试 内容多,一般可能确实还 ...

  7. 兴业银行总行信息科技部笔试+面试经验

    1.笔试: 专业选择题,没有行测,但是题目内容很杂,涉及数据挖掘,java,c,算法数据甚至还有硬件. 编程题:c语言的两道题,java一道题自己选,具体题目忘了,应该是个dfs的题 2.一面:给了一 ...

  8. 2021届中信银行总行信息科技部笔试面试经历

    笔试: 中信的笔试时间是10月下旬,是线上的方式,内容包括计算机.行测.英语单选和阅读,时间是一起算的,可以自由分配.但是当时每次翻页选项顺序会变,让我这个把选项写在纸上的人差点全选错... 面试 中 ...

  9. 大数据计算的6大关键技术与4大应用场景探索!

    | 转载自:DataFun | 编辑:钱英宇 | 设计:张千禧 大数据和AI的能力在企业应用中发挥着越来越重要的价值,企业在提升数字化转型带来的数字到知识萃取助力于业务的同时,面对海量数据的增长,离不 ...

最新文章

  1. MIT将AI引入中学课堂,除了设计AI系统,还要学生思考背后的伦理
  2. linux中配置DHCP基本操作
  3. Altair Compose2020中文版
  4. Oracle sql解析类型, 软解析和硬解析浅析
  5. redis smembersmap_Redis数据类型及常用API
  6. python数据处理与机器学习
  7. mysql order by 固定_MySQL 强制操作以及order by 使用
  8. smarq v7 智器 v7 新手使用
  9. 机器视觉产业链全解析
  10. 中国省份城市0-N编号
  11. 双线性插值GPU加速
  12. 淘系双十一全链路压测流程概览
  13. Springboot链接SqlServer配置并通过JPA操作实战
  14. mysql语句解决查询乱码_mysql5.0用命令行查询正常,但用sql就乱码,已经加了useUnicode=truecharacterEncoding=GBK,该如何处理 _ 搞代码...
  15. Unity制作RPG游戏——补充
  16. layer的btn按钮
  17. 双非渣本,他是如何逆袭拿到3W高薪
  18. Y件DOOK: VSC 安装 谷歌浏览器调试 固件插件 Debugger for Chorme
  19. matlab决策树模型过程,利用MATLAB统计工具箱进行决策树分类的一个例子
  20. Linux远程联机服务器SSH VNC XDMCP RDP

热门文章

  1. linux基础概念和个人笔记总结(6)
  2. Exchange Server 2010 全新部署篇八:CASHUB中集线器配置部分
  3. MySQL5.5编译安装
  4. 在WebAPI中自动创建Controller
  5. T-SQL Cstr函数
  6. 关于从基于Mult-Org的视图中查询数据的问题(转)
  7. Failure Groups in ASM
  8. 关于vscode的插件配置
  9. 系统集成项目管理工程师教程(第2版)带书签目录
  10. 深入理解JavaScript类数组