摘要:在2018年1月6日的云栖社区数据智能技术论坛上,蚂蚁金服的周俊(花名西亭)做了题为《蚂蚁金服智能金融实践》的主题演讲。目前金融场景应用的越来越多,对金融服务也提出了更多的挑战,西亭介绍了蚂蚁金服为应对挑战进行的系统性风险的预测与监控,基于用户语义和近期操作行为的智能助理以及精准营销与推荐服务等技术,此外,他还介绍了基于AI的车辆定损产品。

以下为精彩视频整理:

目前智能技术场景应用的越来越多,比如微贷,保险,支付,风控,财富等等,对金融服务也提出了更多的挑战,比如:时间敏感,海量数据,业务多样性,系统风险性,强安全,自动化等。在图像/语音、NLP、机器学习、推理与决策等领域,应用强化学习、无监督学习、图推理、迁移学习等技术,在大规模数据的情况下,期望实现快速处理和实时对抗。

深度学习+图:系统性风险预测与监控

对于用户资金的安全,需要在用户账号、设备和商户三端来进行保障。传统的风控技术是基于规则和策略来实现。随着案例增多,加的规则也越来越多,传统的模型较难符合当前的需求。蚂蚁金服是采用树模型对于非可信交易进一步判断是否账号被盗。同时采用GBDT+DNN进一步改进盗账号模型,目前提升了10%检测率。以支付宝为例,每天可以让一千多万笔交易更快更准地通过风险检查。这对系统本身、公司成本、用户安全感的提升,都非常有利。
下面介绍图学习模型的另外一个应用案例:垃圾账户识别

业务有关的网络数据,通过Structure2vec深度网络技术(Structure2vec可以根据少量的标注数据,来判断用户是好人还是坏人)对图进行向量化表征,然后根据业务特点优化目标。在用户注册时,利用用户、设备的关联去构建图,并判断账户是否为垃圾账户。这样能对垃圾账户的注册进行防控,降低后端风险基数,稳定大盘指标,极大提高整体的账户质量。与Node2Vec和规则等技术对比,Structure2vec的提升效果较明显。

在一些垃圾邮件中,有些汉字机器不能识别(比如“银行”写成“钅艮”和“彳亍”)。为了尝试解决这个问题,可利用汉字的笔画信息,将这些字拆成单一字,再拆分成笔画,利用ID来表示这些笔画,生成N元笔画信息,进而生成中文词向量。这个方法对词语有较好的识别作用,可以一定程度上处理用户输入的恶意信息,保证内容安全。

智能助理:超越人的满意度的智能客服

在蚂蚁财富APP里面,用户可以点击客服机器人头像或是社区机器人,讨论或直接输入问题,与机器人对话。为了改善智能客服,针对客服机器人,结合用户行为轨迹的进行语义匹配。比如根据用户的输入“怎么申请钱退回来”,再根据用户近期的转账行为,通过深度学习去做语义匹配,可以返回用户想要知道的问题的可能答案。这个模型在2016“双十一”的自助率为 97%,客服机器人满意度超越人工客服 3个百分点;针对财富号机器人,构建基于金融领域情感知识库。通过对模板的情感单元抽取,利用情感知识库计算情感单元的正负情感得分,汇总所有情感单元的得分得到总情感得分,再加上卷积神经网络(CNN)和张量神经网络(TNN)组合,输出新闻文本的最终得分,其准确率可以达到88.4%。

基于哈希的海量特征提取:快速、高效

通过深度学习和在线学习构建了基于参数服务器的大规模机器学习框架。该框架具有数据与模型并行、鲁棒故障切换、同步和异步-迭代、支持1000亿特征、1000亿样本、10000亿参数等特点。在安全可信交易识别模型中,相同覆盖度的情况下,案件召回率从91% 增加到 98%;每天可以让一千多万笔交易更快更准地通过风险检查。在典型推荐场景中应用了大规模矩阵分解算法,该算法使用Binary Hash,而非实数向量偏好,通过可忽略的精度损失,来换取大量的预测时间及存储资源节省:1亿*1千万的矩阵分解,在2小时内收敛。在口碑猜你喜欢场景下曝光点击率(CTR)有明显提升:有头条版本点击率:2.5%->5.5左右,升幅超过120%。

深度强化学习:时序决策——营销与推荐

强化学习营销需要基于实时事件场景人群定向(事件+人群+渠道),多目标(点击+签约)优化融合与在线决策。该模型的算法设计需要从多个业务抽取特征,刻画用户状态;同时对卡片和渠道做组合决策;综合用户的点击和签约行为。实时深度强化模型能实现事件(如登录)实时触发流式计算和模型调用,实时样本回流,保证线上线下特征一致性。与传统深度学习模型相比,实时深度强化模型在推荐卡片点击率提高了171%和最终签约率方面提升了149%。

一键式部署与效果监测

算法贡献者编写算法并进行算法优化,算法应用开发者开发应用和部署应用,解决方案贡献者分享经验和行业方法,解决方案使用者采购方案和集成方案,把这些东西全部沉淀到模型服务平台(水晶球)里面,打造特征工程、模型训练、模型管理、业务系统等整条链路。对内支持支付、口碑等业务,对外通过开放平对外开放给企业伙伴。
模型服务平台(水晶球)具有良好的产品特性:

  • 可视化建模交互:拖拽式的流程组合,辅助式的特征设计,完备的分析评估。
  • 丰富算法接入:机器学习深度学习常规算法;图像金融等垂直领域算法;TensorFlow等开源支持。
  • 海量数据存储计算:超大规模参数服务器;具有GPU,FPGA高性能计算。
  • 全域模型资产管理:社区团队协作;特征共享,实验分享;领域知识沉淀,专家经验积累。
  • 便捷模型部署:一键从建模完成到发布;在离线特征强一致保证。
  • 高效在线预测:99.99%可用性保证;高性能浮点与矩阵运算;标准化接口可插拔算子。
  • 探索式模型演进:支持A/B测试框架;全生命周期模型效果监测;主动发现最优模型和参数。

图像定损产品“定损宝”

行业专家与算法工程师通力合作,通过全链路深度学习,融合噪音去除、目标检测、程度判断、目标分割、决策生成等,实现车辆定损。我国每年的车辆定损案件4500万,其中60% 纯外观损伤案件。案均处理成本为150元,定损宝可减少50%的作业量,同时解决偏远地区或高峰期人力不足的问题。

本文由云栖社区志愿者小组王朝阳整理编辑,程弢审核。

活动相关文章
阿里云朱金童:深度揭秘ET大脑
阿里巴巴阿外:客服全链路智能解决方案
阿里巴巴少杰:大数据处理实践
浙江大学杨洋:社交网络中的群体用户行为分析与表示学习
阿里巴巴iDST杨森:智能决策在电商平台的应用
阿里巴巴布民:图计算是生产力

蚂蚁金服西亭:智能金融的技术挑战与方案相关推荐

  1. 蚂蚁金服李小龙:“人工智能+金融”机遇与挑战并存,蚂蚁金服都做了什么?...

    编者按:由中国人工智能学会.阿里巴巴以及蚂蚁金服联合主办,CSDN.中国科学院自动化研究所承办的第三届中国人工智能大会(CCAI 2017)将于7月22-23日正式召开,届时,蚂蚁金服人工智能部技术总 ...

  2. AI公开课:19.05.16漆远-蚂蚁金服集团CF《金融智能的深度与温度》课堂笔记以及个人感悟—191017再次更新

    AI公开课:19.05.16漆远-蚂蚁金服集团CF<金融智能的深度与温度>课堂笔记以及个人感悟-191017再次更新 导读         漆远,麻省理工学院博士后,39岁被评为美国普渡大 ...

  3. 报名 | 想在硅谷近距离接触蚂蚁金服的CTO和一众技术高管?这个机会一定不能错过!...

    ​想了解蚂蚁金服?想和蚂蚁金服成为合作伙伴?想在蚂蚁金服找到工作?来这场大会就对了! 去年,包含支付宝业务的蚂蚁金服完成了 45 亿美元融资,创造了当时全球互联网行业单笔私募融资的记录,也成为了全球估 ...

  4. 从蚂蚁金服一窥人工智能在金融领域的机遇与挑战

    从蚂蚁金服一窥人工智能在金融领域的机遇与挑战 CCAI 蚂蚁金服 人工智能 金融 中国人工智能大会 阅读2469  编者按:由中国人工智能学会.阿里巴巴以及蚂蚁金服联合主办,CSDN.中国科学院自动化 ...

  5. 蚂蚁金服开放计算架构:下一代金融级计算架构

    当前互联网技术早已进入了大数据.人工智能的阶段,各种计算模式,计算引擎层出不穷.从10年前的MapReduce分布式计算开始,几乎每三年就会出现一次新的计算引擎更迭,从开山鼻祖的Hadoop,到后来流 ...

  6. 蚂蚁金服ATEC城市峰会上海举行,三大发布迎接金融科技2019

    2019年1月4日,蚂蚁金服ATEC城市峰会以"数字金融新原力(The New Force of Digital Finance)"为主题在上海举办.稠州银行副行长程杰.蚂蚁金服副 ...

  7. 蚂蚁金服首席架构师:区块链技术如何促进数字普惠金融

    今天我们正处于技术创新的黄金时代,而这种前所未有的新技术红利也在推动着金融行业发生巨变.比如年初时AlphaGO激起了AI的热潮,而随后口袋妖怪的流行让大家第一次体验到AI和VR的技术可以真切地走入生 ...

  8. SOFAEnclave:蚂蚁金服新一代可信编程环境,让机密计算为金融业务保驾护航102年

    引言 互联网金融本质上是对大量敏感数据的处理以及由此沉淀的关键业务智能.近年来涌现出来的新业态更是将数据处理的范畴从单方数据扩展到了涉及合作方的多方数据. 另一方面,从 GDPR 到 HIPAA,数据 ...

  9. 报名 | 蚂蚁金服ATEC科技大会 · 上海:数字金融新原力

    小蚂蚁说: 2019年1月4日,蚂蚁金服ATEC城市峰会将以"数字金融新原力(The New Force of Digital Finance)"为主题,在中国上海举办.蚂蚁金服A ...

最新文章

  1. 理解VMware Team中的虚拟网络
  2. SAP FI模块与SD、MM的接口配置基本方法
  3. PHP编译遇到的问题
  4. 在LNMP或Nginx上配置NameCheap免费SSL证书
  5. c++ cstring 转换 char_cstring.h库常用函数
  6. matlab数值很小出错,求大神帮忙解决一下,用MATLAB求解动力学数据总是出错~ - 计算模拟 - 小木虫 - 学术 科研 互动社区...
  7. 配置 mysql/mariadb sphinxSE 错误解决 1st column must be bigint to accept 64-bit DOCID
  8. php类型运算符,PHP-运算符类型
  9. oracle 监听 开机启动命令,如何让oracle DB、监听和oem开机启动(dbstart)
  10. 内蒙古12333注册链接不上服务器,内蒙古12333登录
  11. 网易云到“网抑云”:分析用户运营的指标监控和召回机制
  12. 领带的10种打法图解
  13. mysql使用什么语句为指定_在MySQL中,可以使用_____语句来为指定数据库添加用户。...
  14. 音频-基于Core Audio技术采集音频(版本2)
  15. 神舟笔记本电脑降低声音
  16. Letv电视品牌升级为乐融,携手漫威打造超级营销
  17. java分数的加法_分数加法
  18. 令人肝肠寸断的100个签名
  19. 金蝶K3数据库优化/备份操作指南
  20. Swift语言学习(二)

热门文章

  1. soloV2保姆级教程(含环境配置,训练自己的数据集,代码逻辑分析等。能踩得坑都踩了....)更新ing
  2. 多多情报通:拼多多店铺不交保证金能卖货吗?有什么影响吗?
  3. el-dialog更换顶部头部背景色样式
  4. Pytorch中tensor维度和torch.max()函数中dim参数的理解
  5. 马云的又一招棋,平台基因怎么让飞猪成为出境游领军者
  6. 【Linux】常用抓包方式
  7. python网页登录钉钉_【Python】关于钉钉接口使用Python,Post 500报错
  8. 技术点:手写axios
  9. Facebook也要玩智能眼镜
  10. java指针压缩临界值