摘要:通过迁移学习技术,解决少量数据(较少重叠样本和特征)和个性化(较少标记)的问题,从数据丰富的领域迁移到数据匮乏的领域。通过迁移学习在保证模型准确率的同时,也提高了建造模型的效率,快速解决问题。

关键词:迁移学习,联邦学习

1.引言

迁移学习(Transfer Learning)是一种机器学习技术,它通过将某个领域或任务上学习到的知识或模式应用到不同但相关的领域或问题中。迁移学习同时也是一种优化,它允许在第二个任务上建模时取得快速进步和改善性能。

迁移学习其实离我们的生活并不遥远,人类的迁移学习能力其实是与生俱来的。例如,如果我们已经会打乒乓球,就可以类比学习打网球;已经学会英语,就可以类比着来学习其他语言;再如,如果我们已经会下中国象棋,就可以类比着下国际象棋。

根据学习方法的不同,迁移学习可以分为以下四个大类:基于实例的迁移学习(Instance Based Transfer Learning),基于特征的迁移学习(Feature Based Transfer Learning),基于模型的迁移学习(Model Based Transfer Learning)以及基于关系的迁移学习(Relation Based Transfer Learning)。其中比较热门的是基于特征和模型的迁移方式。

2.迁移学习与联邦学习的区别与联系

在迁移学习中,我们已有的知识叫做源域(Source Domain),要学习的新知识叫目标域(Target Domain)。在机器学习领域中,迁移学习研究如何将已有模型应用到新的不同的、但有一定关联的领域中。传统机器学习在应对数据的分布、维度,以及模型的输出变化等任务时,模型不够灵活、结果不够理想,而迁移学习放松了这些假设。在数据分布、特征维度以及模型输出变化条件下,有机地利用源域中的知识来对目标域更好地建模。另外,在有标定数据缺乏的情况下,迁移学习可以很好地利用相关领域有标定的数据完成数据的标定。

图 1 迁移学习过程示例

说到迁移学习,大家经常首先想到的是热词“联邦学习(联邦机器学习)”,联邦机器学习是一个机器学习框架,包括模型训练和模型推理两个过程。而迁移学习和联邦学习两者之间也是有明显区分的。联邦学习是把“碎数据”和“数据孤岛”连接起来,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。而迁移学习是从“大数据”到“小数据”的迁移,重点解决了“小数据”的问题,让知识可以从一个源领域迁移到另一个目标领域,是一种“举一反三”的学习能力。

两者之间又存在着紧密的联系,比如在进行联邦学习时常常需要做知识迁移,因为数据孤岛分布不均匀,有的大有的小。于是后来有专家提出的“联邦迁移学习”,这正是把联邦学习和迁移学习结合起来,发挥两种机器学习的优势。让不同机构在保护数据隐私的前提下合作,没有算法、领域、数据类型的限制,而且模型效果无损失。

3.迁移学习解决的主要问题

迁移学习中存在的三个研究问题,即“迁移什么”、“如何迁移”和“何时迁移”。而结合迁移学习的特性,从应用场景的角度,迁移学习解决的主要问题包括:

(1)小数据的问题。比如在网上销售一种新产品A,考虑到没有历史数据作为依据,无法建立模型对用户进行推荐。但用户买某个产品的同时同样有机会购买另外一些产品,所以如果知道用户在另外一个领域,已经有了积累的销售数据,比如产品B,利用这些数据建一个模型,结合用户买B产品习惯和A产品习惯的关联,我们就可以把B产品的推荐模型给成功地迁移到A产品的领域,这样,在数据不多的情况下可以成功推荐一些用户可能喜欢的A产品。这个例子就说明,我们有两个领域,一个领域已经有很多的数据,能成功地建一个模型,有一个领域数据不多,但是和前面那个领域是关联的,就可以把那个模型给迁移过来。

(2)个性化的问题。比如我们每个人都希望自己的手机能够记住一些习惯,这样不用每次都去设定它,我们怎么才能让手机记住这一点呢?其实可以通过迁移学习把一个通用的用户使用手机的模型迁移到个性化的数据上面。所谓的千人前面其实就是大量的用户数据分析,推荐最精准的功能产品,比如银行APP首页的展示,也是根据用户手机操作的偏好来排列展示,任何操作应该控制在3步以内。

4.迁移学习的实际应用

(1)机器人训练

在实际的机器人上训练模型是非常缓慢和昂贵的。从模拟中学习并且将知识迁移到现实世界的机器人上的方式能缓解这个问题,并且这种方面最近正得到越来越多的关注。例如自动驾驶汽车。早在5年前Udacity已经开源了它用来进行无人驾驶汽车工程纳米学位教学的模拟器,OpenAI 的 Universe平台通过视频游戏来训练无人驾驶汽车。

(2)图像理解

从目标识别到行为识别的很多图像理解任务已经运用了迁移学习。通常,这些计算机视觉任务需要大量有标签数据来训练模型,例如使用众所周知的 ImageNet 数据集。然而,当计算机视觉的情景稍有变化(例如从室内到室外、从静止摄像机变为移动摄像机)时,需要调整模型以适应新情况。迁移学习是解决这些适应问题的常用技术。

(3)推荐系统

迁移学习也可以用在推荐系统中,在某个领域做好一个推荐系统,然后应用在稀疏的、新的垂直领域。比如在图书商城搜索的行业书籍,可以应用到不同题材类型的电影。

(4)自然语言处理和文本挖掘

文本挖掘旨在从文本中发现有用的结构性知识并将其应用于其他领域中。在文本挖掘的所有问题中,文本分类旨在用不同的类标签标记新的文本文档。一个典型的文本分类问题是情感分类。在线论坛、博客、社交网络等在线网站上有大量用户生成的内容,能够总结消费者对产品和服务的看法非常重要。情感分类能够通过将评论分为正面和负面两个类别来解决这个问题。但是,在不同的域中,例如不同类型的产品、不同类型的在线网站、不同的行业,用户可能使用不同的词语表达他们具有相同情感的观点。因此,在一个域上训练的情感分类器可能在其他域上表现不佳。在这种情况下,迁移学习可以帮助调整已训练完成的情感分类器以适应不同的领域。

(4)个性化对话

先训练一个通用型的对话系统,然后再根据特定领域的小数据修正它,使得这个对话系统适应该特定领域的任务。比如,一个银行客户需要办理信用卡,他并不想回答所有繁琐的问题,例如信用卡种类,信用卡申请额度,信用卡还款方式、信用卡账单接收方式等。

图 2 个性化对话系统

5.金融领域迁移学习模型设计应用

(1)金融产品个性化设计

以智慧消费金融为例,通过机器学习设计,为信用良好的消费者人群提供定制化的金融服务,鼓励其进行消费。在这里智慧消费金融中,设计的数据特征包括消费者的资质信息、购买能力、购买偏好及商品特征等。而这些数据特征由不同的单位或公司进行管理。比如一个消费者的资质信息和购买能力可以从银行、工商、税务、房产等多个维度进行判断,对于不同商品或服务的购买能力,可以从社交网络中分析得出,而商品的特征可以由电商平台记录中获取。

图 3 智慧消费金融迁移学习

在这种场景下面临了数据隐私、数据异构融合的问题,传统的机器学习方法不能有效地解决。而利用迁移学习建立定制化模型,,同时解决数据的异构问题,克服传统AI技术的局限性。

(2)跨机构的金融产品迁移

比如在金融领域中,各家银行的风控模型存在不同,但模型设计的目标是一致的,起到风险防控、信用评级的作用。那么我们可以设计A银行的信用评估模型通过迁移学习的方式运用到B银行,对个人或者企业的信用进行评分评级。而这之间区别在于可能A、B银行因为所处地理位置不同导致客户群体分布不同,这时如果A、B银行都使用同一套信用评估模型,必然会造成评估结果的不准确。迁移学习很好的解决了这个问题,通过借鉴A银行模型中B银行相似的部分,可以建立起属于B银行独家的信用评估模型,给不同银行提供了个性化模型的可能性。

通过迁移学习的方式,将企业成长力模型迁移到了新的授信模型体系中。其中迁移主要体现在以下两个方面:

1. 企业成长力模型的迁移到调节项模型中。

2. “基础+附加”思想的迁移。

通过迁移学习的方式,我们成功建立了B银行的授信评估模型。整个模型的计算逻辑如下图所示:

图 4 模型计算逻辑

其中基础额度模型是选取最重要的几个指标所建立的模型,而调节项模型是通过迁移学习的方式迁移了企业成长力模型,再在企业成长力模型的基础上加以优化调节,使得模型更符合B银行的业务要求。其中调节优化包括:

1. 增加更多企业成长力模型并未涉及的特征,比如B银行要求的新的企业能力指标。

2. 子指标得到父指标的计算方式。

3. 针对B银行给出的验证数据进行各级指标的权重调整,使最终模型更适合B银行的业务对象。

图 5 不同模型预测能力对比

6.结束语

迁移学习可以成为“小数据挑战”的技术解决方案。利用这些模型从数据丰富的领域迁移到数据匮乏的领域,那么久有可能使这些数据匮乏的领域更快地迈向一个以信息和知识为基础的社会。当我们见证人类历史最基本的人工智能革命之一时,迁移学习作为一个深入的研究领域脱颖而出,它激发了新的想法和思想,使之深入到智能的本质。

在金融业务不断开拓创新时,从产品设计、开发、测试整个流程中利用迁移学习,能够实现降本增效,控制风险,做到事半功倍。相信在未来不断探索中更多的金融应用场景会悄然而生。

参考文献

[1] 杨强 张宇 戴文渊 潘嘉林 著.《迁移学习》.机械工业出版社. 2020年

[2] 杨强.《人工智能专家如何解决金融难题》.北大金融评论总第3期. 2020年

[3] 机器之心.《什么是迁移学习?迁移学习的场景与应用》.知乎.2019年

作者介绍:盛瀚 北京银行

迁移学习在金融行业的应用探索相关推荐

  1. T5,一个探索迁移学习边界的模型

    作者 | Ajit Rajasekharan 译者 | 夕颜 出品 | AI科技大本营(ID:rgznai100) [导读]10月,Google 在<Exploring the Limits o ...

  2. 读懂深度迁移学习,看这文就够了 | 赠书

    百度前首席科学家.斯坦福大学副教授吴恩达(Andrew Ng)曾经说过:迁移学习将是继监督学习之后的下一个促使机器学习成功商业化的驱动力. 本文选自<深度学习500问:AI工程师面试宝典> ...

  3. Facebook增强版LASER开源:零样本迁移学习,支持93种语言

    来源| Facebook AI 研究院 译者 | Linstancy 责编 | 琥珀 出品 | AI 科技大本营(ID:rgznai100) [导语]为了加速自然语言处理 (NLP) 在更多语言上实现 ...

  4. 《预训练周刊》第17期:深度迁移学习与数据增强改善2型糖尿病预测、钢琴补谱应用...

    No.17 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第17期&l ...

  5. 带你用深度学习虚拟机进行文本迁移学习(附代码)

    作者:Anusua Trivedi.Wee Hyong Tok 翻译:付宇帅 校对:卢苗苗 本文5302字,建议阅读10分钟. 本文讲述了现代机器学习的模型,主要由微软数据科学家Anusua Triv ...

  6. 谷歌提出“T5” 新NLP模型,突破迁移学习局限,多基准测试达SOTA!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 转载自:AI科技评论 过去几年间,迁移学习给 NLP 领域带来了丰硕的成果,掀起了 ...

  7. 联邦学习 OR 迁移学习?No,我们需要联邦迁移学习

    2020-11-18 13:40:43 机器之心分析师网络 作者:仵冀颖 编辑:H4O 在这篇文章中,作者通过 4 篇论文详细介绍了联邦学习中的联邦迁移学习问题,并探讨了向经典联邦学习中引入迁移学习的 ...

  8. 官方解读,谷歌“T5”模型,如何突破迁移学习局限,实现多基准测试SOTA

    2020-02-25 14:35 导语:实现多基准测试SOTA. 过去几年间,迁移学习给 NLP 领域带来了丰硕的成果,掀起了新一波的发展浪潮.而迁移学习之所以如此有效,得益于其利用自监督任务(如语言 ...

  9. 将同构迁移学习应用于脑机接口,解决训练数据不足的问题

    脑机接口 (BCI) 通过识别大脑活动并将其转化为外部命令,提供了大脑与外部设备之间的另一种通信方式.功能性近红外光谱 (fNIRS) 作为一种非侵入性的大脑活动检测方式正变得越来越流行. 基于人工智 ...

  10. 【深度学习】计算机视觉相关技术探索(一)

    [深度学习]计算机视觉相关技术探索(一) 文章目录 1 计算机视觉概述 2 使用机器学习解决图像分类问题 3 Keras和神经网络简介 4 卷积神经网络(CNN),迁移学习 5 对象检测问题 6 yo ...

最新文章

  1. 图像直接卷积 Sobel 边缘实现
  2. 学科顶尖!这些高校,“双一流”潜力股!
  3. SQLServer 大小写敏感配置
  4. JENKINS使用DOCKER运行PYTEST并且出ALLURE报告
  5. linux uvc stm32,linux uvc深入理解(三)
  6. 安装Aanconda详细教程
  7. 01函数极限的概念及性质
  8. LuoguP3674 小清新人渣的本愿 BZOJ4810: [Ynoi2017]由乃的玉米田
  9. oracle重做日志的信息,Oracle重做日志和日志挖掘
  10. RoboBee和RoboFly领衔微型昆虫机器人:从“上天入海”到“挣脱束缚”
  11. 计算机开机两个系统消失,电脑win7系统开机有2个或多个系统选项 删除多余系统引导选项方法...
  12. minus 如何实现不去重效果
  13. 前端javascript常见问题总结
  14. android.nfc.tech圈存,微信etc圈存教程:1分钟学会ETC充值圈存
  15. 【产业互联网周报】AI独角兽们集体亮相安博会,侧重点各不相同;BAT智慧城市布局进一步加深...
  16. svg果冻弹性按钮动画js特效
  17. 手机号时间戳加密传到前端_如何在不到一个小时的时间内加密您的一生
  18. 维汉一家亲 60岁维族大妈免费教市民跳新疆舞(图)
  19. MySQL自定义函数实例
  20. 如何编写好的代码/成为一个更好的程序员

热门文章

  1. 【正点原子MP157连载】 第九章 TF-A移植-摘自【正点原子】【正点原子】STM32MP1嵌入式Linux驱动开发指南V1.7
  2. linux 百度云 备份软件下载,Linux 安装百度云,自动备份服务器资料
  3. Spanning-tree guard features配置案例
  4. 360浏览器打开html不能正常显示图片,“网页图片显示异常,网页图片、验证码显示不正常,经常显示不全或根本不显示”的解决方案...
  5. cisco2960(思科2960)
  6. Cisco 2960交换机排错
  7. PSNRSSIMVIF指标-python版本
  8. 三国志战略版360区S4服务器合并信息,三国志战略版s3赛季服务器合并与规则一览...
  9. 家用 linux 路由器教程,Ubuntu 搭建无线路由器
  10. 【机器学习】(十)核支持向量机SVM:make_blobs方法,hstack() 函数