本文内容节选自《迁移学习》一书。由杨强教授领衔撰写。

迁移学习解决的是系统如何快速地适应新场景、新任务和新环境的问题,在目标域中只有少量标记数据可用时,它赋予了机器学习系统利用辅助数据和模型来解决目标问题的能力。这使得机器学习系统更加可靠和健壮,并且让机器学习模型在面对不可预见的变化时尽可能达到预期的性能。在企业层面,迁移学习允许知识的重复利用,使得每次获得的经验可以重复地应用于现实世界。

本书为迁移学习方向首本算法、理论、应用方面成熟、成体系的总结,相关领域研究的系统性参考。

想要了解关于迁移学习的更多干货知识,关注CSDN并评论分享你对本文的学习心得或迁移学习的见解,我们将从中选出5条优质评论,各送出《迁移学习》一本。活动截止时间为8月30日晚8点

图像理解

从目标识别到行为识别的很多图像理解任务已经运用了迁移学习。通常,这些计算机视觉任务需要大量有标签数据来训练模型,例如使用众所周知的 ImageNet 数据集。然而,当计算机视觉的情景稍有变化(例如从室内到室外、从静止摄像机变为移动摄像机)时,需要调整模型以适应新情况。迁移学习是解决这些适应问题的常用技术。

在图像分析领域,许多最近的方法将深度学习架构和迁移学习相结合。例如,Long 等人(2015)利用深度学习框架将源域和目标域之间的距离最小化。在 Facebook 上发表的一篇文章中,Mahajan 等人(2018)将迁移学习应用到图像分类中。该方法首先在非常大的图像数据集上训练深度学习模型,然后在目标域的特定任务中利用相对少量的有标签数据对预先训练的模型进行调整。该模型是一个为基于数十亿社交媒体图片主题标签的分类任务而训练的深度卷积网络,目标任务是目标识别或图像分类。

他们的分析表明,增加预训练数据集的大小以及在源任务和目标任务之间选择密切相关的标签空间都很重要。这一观察结果说明,迁移学习需要设计“标签空间工程”方法以匹配源和目标的学习任务。他们的工作还表明,可以通过提高源模型的复杂度和增加数据集大小获得对目标任务的改进。

迁移学习还使得图像分析在具有巨大社会影响的应用中发挥重要作用。在 Xie 等人(2016)的研究中,斯坦福大学地球科学的学者基于卫星图像, 利用迁移学习来预测全球贫困水平。首先,他们使用白天的图像预测夜间光照图像,然后将所得模型迁移到预测贫困的问题上。与传统的基于调查的方法相比,该方法得到了非常准确的预测结果并且只需要很少的人工标注工作。

生物信息学和生物成像

在生物学中,许多实验成本高昂且数据很少。例如,医生尝试使用计算机发现潜在疾病时的生物成像,以及使用软件模型扫描复杂的 DNA 和蛋白质序列以寻找特定疾病以及治愈的模式。迁移学习越来越多地被用于帮助将知识从一个领域迁移到另一个领域来解决生物学中有标签数据获取成本高昂的难题。

例如,Xu 和 Yang(2011)对在生物信息学应用中利用迁移学习和多任务学习进行了早期调研。Xu 等人(2011)提出了一种迁移学习过程以识别在有标签数据极少的目标域中的蛋白质细胞结构。在生物医学图像分析中,一个难题是收集足够的训练数据来训练模型以识别诸如癌症等指定疾病的图像模式。这种识别需要大量的训练数据。然而,这些数据通常因为需要专家进行标注而十分昂贵。

此外,预训练模型和未来模型的数据通常来自不同的分布。这些问题激发了许多应用迁移学习来使预训练模型适应新任务的研究工作。例如,在 Shin 等人(2016)的研究中,基于 ImageNet 数据的预训练模型被用作源域模型,然后被迁移到医学成像领域中用于胸腹淋巴结检测和间质性肺病分类,该研究取得了巨大的成功。

推荐系统和协同过滤

通常情况下,由于冷启动问题,在线产品推荐系统难以建立。如果我们能发现域之间的相似性并将推荐模型从一个成熟域适应到新域,那么就可以缓和冷启动问题。这通常可以节省成功完成一个原本不可能的任务所耗费的时间和资源。

例如,Li 等人(2009b)和 Pan 等人(2010b)开创性地将迁移学习应用到了在线推荐领域。在他们的应用中,跨域推荐系统将用户偏好模型从现有域(如图书推荐领域)迁移到一个新域(如电影推荐领域)中。该场景对应于在线商务站点开放新业务线时希望在新业务线中快速部署推荐模型的商业案例。

在这样做时,必须克服新业务线中缺少交易数据的问题。另一项工作是整合强化学习(reinforcement learning)和推荐系统,从而使依据用户历史记录和潜在的兴趣多样性推荐的项目是准确的。例如,Liu 等人(2018)提出了一种在推荐准确度和主体多样性中达到平衡的 bandit 算法,以允许系统挖掘新主题以及迎合用户最近的选择。关于迁移学习,该工作表明平衡探索和利用的推荐策略确实可以在域之间进行迁移。

机器人和汽车自动驾驶

在设计机器人和汽车自动驾驶时,从模拟场景中学习是一种特别有用的方法。在硬件交互部分,收集用于训练强化学习和监督学习模型的有标签数据是十分昂贵的。正如 Taylor 和 Stone(2007) 所描述的,迁移学习能够帮助研究人员在一个或多或少理想的域(源域)中构建模型,然后在目标域中学习处理预期事件的策略。

目标域模型可以处理更多现实世界中的情况,以进一步处理更多未预料到的噪声数据。当模型很好地适应后,可以在重新训练目标域模型的过程中节省大量劳动力和资源。Tai 等人(2017)设计了基于 10 维稀疏范围发现的无地图支持运动规划器,并通过端到端的深度强化学习算法对其进行了训练,然后通过真实样本将学习好的规划器泛化迁移到了现实场景中。

自然语言处理和文本挖掘

文本挖掘是迁移学习算法的一个很好的应用场景。文本挖掘旨在从文本中发现有用的结构性知识并将其应用于其他领域中。在文本挖掘的所有问题中,文本分类旨在用不同的类标签标记新的文本文档。一个典型的文本分类问题是情感分类。

在线论坛、博客、社交网络等在线网站上有大量用户生成的内容,能够总结消费者对产品和服务的看法非常重要。情感分类能够通过将评论分为正面和负面两个类别来解决这个问题。

但是,在不同的域中,例如不同类型的产品、不同类型的在线网站、不同的行业,用户可能使用不同的词语表达他们具有相同情感的观点。因此,在一个域上训练的情感分类器可能在其他域上表现不佳。在这种情况下,迁移学习可以帮助调整已训练完成的情感分类器以适应不同的领域。

近期,对预训练的研究获得了迁移学习本质的新见解。Devlin 等人(2018)发现了迁移学习应用成功的一个条件:拥有足够数量的源域训练数据。例如,谷歌的自然语言处理系统 BERT(Bidirectional Encoder Representations from Transformers,Transformer 的双向编码器表示)(Devlin 等人,2018)将迁移学习应用于许多 NLP 任务中,证明使用强大的预训练模型可以解决许多传统自然语言处理领域的棘手问题(如问答系统)。

在公开的 SQuAD 2.0 竞赛中,BERT 在许多任务中取得了令人惊讶的领先结果(Rajpurkar 等人,2016)。其源域由非常庞大的自然语言文本语料库组成,BERT 使用该语料库训练基于注意力机制的双向 Transformer 模型。预训练模型能够使语言模型中的各种预测比以前更准确,并且其预测能力随着源域中训练数据量的增加而增加。

然后,通过在诸如下一句子分类、问答和命名实体识别(Named Entity Recognition,NER)中向源模型添加额外的较小的层,便可以将 BERT 模型应用于目标域中的特定任务。这种迁移学习方法属于基于模型的迁移,其中大多数超参数保持相同,但是会选择几个超参数通过目标域中的新数据进行调整。


赠书活动

想要了解关于迁移学习的更多干货知识,关注CSDN并在评论区分享你对本文的学习心得或迁移学习的见解,我们将从中选出5条优质评论,各送出《迁移学习》一本,截至8月31日12点,点击阅读原文获取本书详情。

更多精彩推荐
☞Kubernetes 并非灵丹妙药...
☞“云”话数字经济:2020 腾讯全球数字生态大会定档 9 月!
☞蚂蚁上市分给员工 7000 亿股权,曾有人 28 岁财务自由,这次又将产生多少千万富翁?
☞MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件
☞闲鱼的云原生故事:靠什么支撑起万亿的交易规模?
☞云交易所已成资金盘、杀猪盘重灾区,曾被寄予厚望,如今罪恶丛生
点分享点点赞点在看

杨强教授领衔力作,《迁移学习》最新出炉,解决AI“最后一公里”问题 | 赠书...相关推荐

  1. 杨强教授第四范式内部分享:漫谈《西部世界》、GAN及迁移学习

    本文来自AI新媒体量子位(QbitAI) 以下内容根据杨强教授演讲编写,略微有所删减. 有些人看过电视剧<西部世界>-在<西部世界>里,你可能问的一个关键问题是什么?就是当剧中 ...

  2. 科学式家|杨强教授漫谈《西部世界》、生成式对抗网络及迁移学习

    「范式大学」由第四范式发起,致力于成为"数据科学家"的黄埔军校,校长为第四范式首席科学家,华人界首个国际人工智能协会AAAI Fellow.唯一的AAAI 华人执委杨强教授. [范 ...

  3. 深度学习 - 强化学习 -迁移学习(杨强教授报告)

    李宏毅机器学习课程-Transfer Learning 深度学习 -> 强化学习 ->迁移学习(杨强教授报告) 链接: http://pan.baidu.com/s/1nu6DMRn 密码 ...

  4. 杨强教授演讲视频:数据要素与联邦学习(附文字摘要)

    关注"亨利笔记"公众号,后台回复: 数据要素,可获取杨强教授演讲PPT.回复 kubefate,可以加入联邦学习开源项目 KubeFATE 交流群. 9月25日,VMware 联合 ...

  5. 专访 | 杨强教授谈CCAI、深度学习泡沫与人工智能入门

    文 | 胡永波 7 月 22 - 23 日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办的第三届中国人工智能大会(CCAI 2017)将在杭州国际会 ...

  6. 7月7日云栖精选夜读:专访 | 杨强教授谈CCAI、深度学习泡沫与人工智能入门

    摘要: 中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办,云栖社区作为独家直播合作伙伴的第三届中国人工智能大会(CCAI 2017)将在杭州国际会议中心盛 ...

  7. 杨强教授:《可信联邦学习与开源生态》主题演讲视频

    题图摄于天安门广场 9月26日,由 LF AI & DATA 基金会主办的AICON 2022在杭州成功举办!来自全球的人工智能领域顶尖科学家.行业专家及著名企业家齐聚一堂,分享全球人工智能行 ...

  8. 演讲实录丨CAAI名誉副理事长杨强教授:人工智能的金融实践

    杨强 CAAI 名誉副理事长.微众银行首席人工智能官 AAAI/ACM/IEEE/CAAI/AAAS Fellow 转自中国人工智能学会 CAAI原创 丨 作者杨强教授 以下是杨强教授的演讲实录: 今 ...

  9. 杨强教授力荐,快速部署落地深度学习应用的实践手册

    香港科技大学计算机科学与工程学系讲座教授.国际人工智能联合会(IJCAI)理事会主席(2017-2019).深圳前海微众银行首席AI 官 杨强为<深度学习模型及应用详解>一书撰序,他提到现 ...

最新文章

  1. spark hive udf java_【填坑六】 spark-sql无法加载Hive UDF的jar
  2. muduo:高效整型转换为字符串
  3. Web安全系列(二):XSS 攻击进阶(初探 XSS Payload)
  4. CSS中清除浮动的两种方式
  5. java使用POI获取sheet、行数、列数
  6. 2018-10-03-Python全栈开发-day60-django序列化-part3
  7. Web工程师必备的可视化工具
  8. 超慢速移动动画使用CSS3实现流畅效果
  9. postgresql分页用法_postgresql分页数据重复问题的深入理解
  10. JAVA基础之变量(数据类型及其转换)
  11. openfiler 搭建虚拟存储 并 配置服务端
  12. jquery 几个实用的小方法
  13. 【SQL Server】入门教程-基础篇(一)
  14. dnf仓库打不开怎么办,dnf仓库打不开_DNF仓库锁。设置之后,点了强制解除。然后仓库打不......
  15. 什么是软件测试吞吐量,在软件测试中吞吐量与TPS有什么区别与联系
  16. 远程桌面3389加固
  17. 台电平板teclast X16HD碎屏拆机更换日志
  18. Android 获取 OAID ,替换 IMEI (兼容 Android 10获取IMEI问题)
  19. 分布式定时任务原理以及解决方案-指定时间执行定时任务
  20. 快捷键使电脑屏幕翻转

热门文章

  1. Python字符串的格式化,看这一篇就够了
  2. 非常好用的终端命令,稀饭~
  3. iOS的四种持久化存储
  4. 右上角鼠标滑过展开收缩动画效果js代码的演示页面
  5. 安装oracle 12c遇到问题
  6. ajax 页面部分先显示图片后出数据
  7. configure 查看默认安装路径
  8. QPushButton/QLabel在鼠标悬浮(划过, hover)、选中(单击, pressed)状态下更换图标样式
  9. 【绘图】matlab 绘制窗口分布
  10. 使用link 链接外部样式和网站logo,减少html文档Style部分的信息量