from:https://www.jianshu.com/p/8ed0703db2c7
作者:caokai1073
链接:https://www.jianshu.com/p/8ed0703db2c7
来源:简书

另:TrAdaBoost源码剖析

为什么要TrAdaBoost

传统的机器学习,有一个假设: 训练集和测试集分布相同。而事实上,在许多情况下,这种单一分布假设不成立。如果来了一批新的数据(new data),分布与之前的训练的旧数据(old data)不一样,那么我们的算法的准确率就会下降很多。但是使用新数据,完全抛弃旧数据,有两个问题。第一,新数据可能量不够;第二,旧数据可能还有利用价值,完全抛弃太浪费。所以才有了迁移学习,从旧数据从提取信息,用于新的模型训练。

TrAdaBoost算法,是一种从old data中提取实例的方法,即将一部分能用的old labeled data,结合new labeled data(可能是少量),构建出比单纯使用new labeled data训练更精确的模型。

TrAdaBoost算法

以测试数据空间为基准,new data有一样数据分布空间,记为X_s,old data是不一样的分布空间,记为X_d。假设是二分类问题,labels是Y={0,1}。整个训练数据空间是

所以我们就是要找到X->Y的映射函数c。
测试数据集(无标签):


训练数据集:

其中训练集T可以分为来自不同分布的数据T_d和相同分布的数据T_s,


所以全部的训练数据:

有n个数据来自X_d空间,有m个数据来自X_s空间。

整体算法如下:

第一步:归一化每个数据的权重,使其成为一个分布。

第二步:调用弱分类器。将T_d和T_s的数据整体作为训练数据,过程和AdaBoost训练弱分类器一样。这一步也是我们的old data对模型起作用的地方。

第三步:计算错误率。注意,这边只计算T_s中提取的数据,也就是new data。old data在这边不进入计算。而且计算错误率的时候需要将T_s中的提取数据权重重新归一化。

第四步:分别计算T_s和T_d权重调整的速率。注意,每一次迭代,T_s的权重调整速率都不一样,而T_d中的数据,是一样的。Beta_t在AdaBoosting中,相当于每一个弱分类器的话语权有多大,Beta_t越大,该弱分类器话语权越小。

第五步:更新数据权重。T_s中的数据,如果分类错误,则提高权重值,与传统AdaBoost算法一致。T_d中的数据,则相反,如果分类错误,则降低权重值,这是因为分类错误的就认为这部分old data与new data差距太大。

输出。以后半数弱分类器(N/2~N)的投票为准。

参考文献:
[1]W. Dai, Q. Yang, G. Xue, and Y. Yu, “Boosting for Transfer Learning,” Proc. 24th Int’l Conf. Machine Learning, pp. 193-200, June 2007.

迁移学习---TrAdaBoost算法介绍相关推荐

  1. 深度强化学习主流算法介绍(二):DPG系列

    之前的文章可以看这里 深度强化学习主流算法介绍(一):DQN系列 相关论文在这里 开始介绍DPG之前,先回顾下DQN系列 DQN直接训练一个Q Network 去估计每个离散动作的Q值,使用时选择Q值 ...

  2. 一文了解迁移学习经典算法

    来源 | linolzhang的CSDN博客 作者 | linolzhang ▌一. 了解迁移学习 迁移学习(Transfer Learning)目标是将从一个环境中学到的知识用来帮助新环境中的学习任 ...

  3. 集成学习(Ensemble)算法介绍

    Ensemble Model Ensemble Bagging Boosting Stacking AdaBoost Gradient Boosting XGBoost Bagging和Boostin ...

  4. 机器学习-迁移学习的介绍

    1.什么是迁移学习 迁移学习(Transfer Learning)是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中.迁移学习是通过从已学习的相关任务中 ...

  5. 2018-12 文献阅读:Boosting for Transfer Learning(2007)--迁移学习

    2018-12 文献阅读:Boosting for Transfer Learning(2007) 2018-12 文章的作者Wenyuan Dai&Qiang yang&Gui_Ro ...

  6. 吴恩达说“将引领下一波机器学习技术”的迁移学习到底好在哪?

    AI技术年度盛会即将开启!11月8-9日,来自Google.Amazon.微软.Facebook.LinkedIn.阿里巴巴.百度.腾讯.美团.京东.小米.字节跳动.滴滴.商汤.旷视.思必驰.第四范式 ...

  7. 一文讲清楚什么是迁移学习?以及它都用在哪些深度学习场景?

    作者 | Jason Brownlee 翻译 | AI科技大本营 参与 | 刘畅 迁移学习是机器学习方法之一,它可以把为一个任务开发的模型重新用在另一个不同的任务中,并作为另一个任务模型的起点. 这在 ...

  8. 业界首个面向NLP场景深度迁移学习框架

    机器之心发布 机器之心编辑部 阿里云正式开源了深度迁移学习框架 EasyTransfer,本文详细介绍了 EasyTransfer 框架的核心功能 近日,阿里云正式开源了深度迁移学习框架 EasyTr ...

  9. 人脸识别迁移学习的应用

    https://github.com/jindongwang/transferlearning 关于迁移学习的一些资料 这个仓库包含关于迁移学习一些资料,包括:介绍,综述文章,代表工作及其代码,常用数 ...

最新文章

  1. 【Redis】7.使用jedis操作redis数据库
  2. RASP技术攻防之基础篇
  3. 如何将本地python项目部署到服务器上_如何将本地的Django项目部署到云服务器
  4. com.sun.istack.SAXException2: 在对象图中检测到循环。这将产生无限深的 XML
  5. Python连接MySQL及一系列相关操作
  6. java引言_Java C++(引言一)
  7. 引用之函数返回值 函数的返回值为引用类型《三》
  8. 中英文停用词(stop word)列表
  9. 我眼中的《APUE》
  10. 我查查 6.6 去校验分析
  11. kktv电视剧鸿蒙,KKTV K70系列新品上市 京东、天猫、苏宁易购同步预售
  12. js 中国时间转换美国太平洋标准时间
  13. python接私活王者_Python从青铜到王者这5个实战项目要会
  14. HISI3559A 使用yolov3 (VI-VPSS-VO)实时目标检测
  15. 巨掌柜,新模式,新机遇!
  16. SpringBoot+Vue搭建前后端分离的轻博客
  17. Windows一键启动jar包bat脚本制作
  18. 微服务网关Gateway实战
  19. 输入整形(Input Shaping)——一种振动抑制方法
  20. 破解“封闭式基金折价之谜”(ZT)

热门文章

  1. swiper 弹出图片_结合swiper使用图片懒加载
  2. 战胜人类最强大脑只是开始,百度大脑“代言”中国人工智能
  3. layui文件上传等待动画
  4. 地平线 J2J3了解笔记
  5. 餐馆会员管理系统 - MySQL数据库课程设计
  6. 前端学习day 10--小米商城首页的制作
  7. Ubuntu下搜狗输入法突然无法输入中文解决方案
  8. 动手学习深度学习——Pytorch版教程系列汇总(长期更新版)
  9. C++计算耗时方法(四种方法)
  10. 阿里云服务器调用阿里云企业邮箱