迁移学习---TrAdaBoost算法介绍
from:https://www.jianshu.com/p/8ed0703db2c7
作者:caokai1073
链接:https://www.jianshu.com/p/8ed0703db2c7
来源:简书
另:TrAdaBoost源码剖析
为什么要TrAdaBoost
传统的机器学习,有一个假设: 训练集和测试集分布相同。而事实上,在许多情况下,这种单一分布假设不成立。如果来了一批新的数据(new data),分布与之前的训练的旧数据(old data)不一样,那么我们的算法的准确率就会下降很多。但是使用新数据,完全抛弃旧数据,有两个问题。第一,新数据可能量不够;第二,旧数据可能还有利用价值,完全抛弃太浪费。所以才有了迁移学习,从旧数据从提取信息,用于新的模型训练。
TrAdaBoost算法,是一种从old data中提取实例的方法,即将一部分能用的old labeled data,结合new labeled data(可能是少量),构建出比单纯使用new labeled data训练更精确的模型。
TrAdaBoost算法
以测试数据空间为基准,new data有一样数据分布空间,记为X_s,old data是不一样的分布空间,记为X_d。假设是二分类问题,labels是Y={0,1}。整个训练数据空间是
所以我们就是要找到X->Y的映射函数c。
测试数据集(无标签):
训练数据集:
其中训练集T可以分为来自不同分布的数据T_d和相同分布的数据T_s,
所以全部的训练数据:
有n个数据来自X_d空间,有m个数据来自X_s空间。
整体算法如下:
第一步:归一化每个数据的权重,使其成为一个分布。
第二步:调用弱分类器。将T_d和T_s的数据整体作为训练数据,过程和AdaBoost训练弱分类器一样。这一步也是我们的old data对模型起作用的地方。
第三步:计算错误率。注意,这边只计算T_s中提取的数据,也就是new data。old data在这边不进入计算。而且计算错误率的时候需要将T_s中的提取数据权重重新归一化。
第四步:分别计算T_s和T_d权重调整的速率。注意,每一次迭代,T_s的权重调整速率都不一样,而T_d中的数据,是一样的。Beta_t在AdaBoosting中,相当于每一个弱分类器的话语权有多大,Beta_t越大,该弱分类器话语权越小。
第五步:更新数据权重。T_s中的数据,如果分类错误,则提高权重值,与传统AdaBoost算法一致。T_d中的数据,则相反,如果分类错误,则降低权重值,这是因为分类错误的就认为这部分old data与new data差距太大。
输出。以后半数弱分类器(N/2~N)的投票为准。
参考文献:
[1]W. Dai, Q. Yang, G. Xue, and Y. Yu, “Boosting for Transfer Learning,” Proc. 24th Int’l Conf. Machine Learning, pp. 193-200, June 2007.
迁移学习---TrAdaBoost算法介绍相关推荐
- 深度强化学习主流算法介绍(二):DPG系列
之前的文章可以看这里 深度强化学习主流算法介绍(一):DQN系列 相关论文在这里 开始介绍DPG之前,先回顾下DQN系列 DQN直接训练一个Q Network 去估计每个离散动作的Q值,使用时选择Q值 ...
- 一文了解迁移学习经典算法
来源 | linolzhang的CSDN博客 作者 | linolzhang ▌一. 了解迁移学习 迁移学习(Transfer Learning)目标是将从一个环境中学到的知识用来帮助新环境中的学习任 ...
- 集成学习(Ensemble)算法介绍
Ensemble Model Ensemble Bagging Boosting Stacking AdaBoost Gradient Boosting XGBoost Bagging和Boostin ...
- 机器学习-迁移学习的介绍
1.什么是迁移学习 迁移学习(Transfer Learning)是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中.迁移学习是通过从已学习的相关任务中 ...
- 2018-12 文献阅读:Boosting for Transfer Learning(2007)--迁移学习
2018-12 文献阅读:Boosting for Transfer Learning(2007) 2018-12 文章的作者Wenyuan Dai&Qiang yang&Gui_Ro ...
- 吴恩达说“将引领下一波机器学习技术”的迁移学习到底好在哪?
AI技术年度盛会即将开启!11月8-9日,来自Google.Amazon.微软.Facebook.LinkedIn.阿里巴巴.百度.腾讯.美团.京东.小米.字节跳动.滴滴.商汤.旷视.思必驰.第四范式 ...
- 一文讲清楚什么是迁移学习?以及它都用在哪些深度学习场景?
作者 | Jason Brownlee 翻译 | AI科技大本营 参与 | 刘畅 迁移学习是机器学习方法之一,它可以把为一个任务开发的模型重新用在另一个不同的任务中,并作为另一个任务模型的起点. 这在 ...
- 业界首个面向NLP场景深度迁移学习框架
机器之心发布 机器之心编辑部 阿里云正式开源了深度迁移学习框架 EasyTransfer,本文详细介绍了 EasyTransfer 框架的核心功能 近日,阿里云正式开源了深度迁移学习框架 EasyTr ...
- 人脸识别迁移学习的应用
https://github.com/jindongwang/transferlearning 关于迁移学习的一些资料 这个仓库包含关于迁移学习一些资料,包括:介绍,综述文章,代表工作及其代码,常用数 ...
最新文章
- 【Redis】7.使用jedis操作redis数据库
- RASP技术攻防之基础篇
- 如何将本地python项目部署到服务器上_如何将本地的Django项目部署到云服务器
- com.sun.istack.SAXException2: 在对象图中检测到循环。这将产生无限深的 XML
- Python连接MySQL及一系列相关操作
- java引言_Java C++(引言一)
- 引用之函数返回值 函数的返回值为引用类型《三》
- 中英文停用词(stop word)列表
- 我眼中的《APUE》
- 我查查 6.6 去校验分析
- kktv电视剧鸿蒙,KKTV K70系列新品上市 京东、天猫、苏宁易购同步预售
- js 中国时间转换美国太平洋标准时间
- python接私活王者_Python从青铜到王者这5个实战项目要会
- HISI3559A 使用yolov3 (VI-VPSS-VO)实时目标检测
- 巨掌柜,新模式,新机遇!
- SpringBoot+Vue搭建前后端分离的轻博客
- Windows一键启动jar包bat脚本制作
- 微服务网关Gateway实战
- 输入整形(Input Shaping)——一种振动抑制方法
- 破解“封闭式基金折价之谜”(ZT)