距离上一篇blog都3个多月了。最近也是有的懒,看到别人的blog层次都很高,总是介绍些opencv的粗浅的东西,总是感觉自惭形愧。所以一直野就没写啥。白驹过隙,3个月,我都转博了,opencv都2.4.3了,可是感觉自己还是弱爆了,懂得太少,翻来看看以前学习过的知识,也多半一知半解。这次就又翻了翻boosting的东西学习了一下(研一上课就这东西听懂了。。。。)。自己看完了,也不知道自己的理解都对不对,欢迎各路高手拍砖指正,不吝赐教。

boosting这东西的思路也很清楚,就是多个弱分类器去学习,和一个强分类器是等价的。而且弱分类学习的算法实现起来要比强分类算法要容易的多。

提到boosting,不得不提最有代表性的adaboost,《A decision-theoretic generalization of on-line learning and an application to boosting》,adaboost就是提高前一轮被分类分错的样本的权重,降低前一轮正确分类样本的权重,最后再用加法模型得到一个总的分类器。关于每个弱分类器的系数以及更新样本权重分布的公式相关文献都有很好的证明,我就不多写了。算法流程如下,我读了几篇相关文献,有几个疑惑或收获吧:

1.关于每次迭代,训练样本的权值分布的更新,各文献的更新公式有所差别,但思想都是一样:分错时,w权重增大,分对时,w权重降低。

2.关于弱分类器的个数,也就是图中的T的确定,是否是个经验值?

然后又读了读online-adaboost,参考的是这篇《online bagging and boosting》,算法流程图如下:

这篇的思想就是对于新来的label的样本,如果更新弱分类器,有点类似online-bagging的做法。仔细看了看这个流程图,虽然没有证明,但我还是有个疑惑,随着训练样本的online增加,我感觉样本输入的顺序,对弱分类器的贡献是递减的,可能是我理解有误,希望高人指点一下~~

还有一篇onlineAdaboosting就是走的不同的路线《online boosting and vision》,文章也是结合他的应用来改进的adaboost算法,把boosting来做feature的select,而非用在weak classifier上。他这么做的好处,就是可以避免计算样本的权重分布,因为online的过程样本很多是未知的。也就是在每个feature pool中选择最具区分度的feature来做当前的分类器。算法流程如下:

为了提高feature pool的多样性,每次还把分类效果最差的分类器更新掉。而且在实际的编程中,还把feature pool的大小由M*N简化到M,这样大大降低了计算量。

最后,又看了看simi-boosting,也是上一篇作者的,结合tracking做的paper《semi-supervised online boosting for robust tracking》,如果细看可以这篇《semiboost:boosting for semi-supervised learning》。思想就是根据unlabeled的data和labeled data的相似度给予一个伪label,然后再做online boosting for feature selection。流程图如下:

写完发现又写的很水,很粗浅。其实也就是我读完了一个简单的笔记。具体的体会还得去看原文来的实在。也不知道我读的这些算不算是经典。如果大家有啥boosting的好文献,也希望多分享。之所以选择tracking作为应用,是因为这几篇有代码可以参考,如果有时间,可以结合code再说说我的心得体会。欢迎大家多提意见多交流,我才疏识浅,难免有错~~

from: http://blog.csdn.net/yang_xian521/article/details/8213128

读了几篇boosting文献的收获相关推荐

  1. 第一篇CrossVIT文献阅读收获体会

    本篇论文是本人阅读的第一篇文献,在听过同学对Transformer模型的讲解之后,作为研一刚看完一边吴恩达视频的小白,直接上手本篇文章,属实有点跨度大.选择本篇文献作为文献阅读报告,实属巧合.在组会上 ...

  2. 如何快速阅读一篇英文文献

    拿到一篇英语文献,我原来的方式是从头读到尾,一边读一边查单词.这样的方式很慢,完整完整读完的文献寥寥可数,读到最后都有一种想呕吐的感觉. 直到我在油管上看到一个外国小哥分享的阅读文献经验视频,我才知道 ...

  3. 如何导出一篇英文文献的全部参考文献

    本人是个文献小白,以前批量导出全部参考文献都是靠知网完成的.但此次处理的文献没有被知网收录,摸索了一段时间,整理出如下的方法供有相同需要的朋友参考. 本方法需要使用EndNote作为文献导入工具,若没 ...

  4. 统计机器翻译中的几篇经典文献

    统计机器翻译中的几篇经典文献 MIT人工智能实验室的<如何做研究>建议阅读本领域中最本质的几篇论文:"如果你对AI的某个子领域感兴趣,向该领域的高年级研究生请教本领域最重要的十篇 ...

  5. 读了这篇文章,你将变身web分析大师

    tml lang="zh-cn"> 读了这篇文章,你将变身web分析大师 - 腾讯云 社区 - 博客园 type="text/css" rel=" ...

  6. Overfeat,RCNN,Sppnet 2014年三篇经典文献及其创新思路总结

    文章目录 0,让人影响深刻的点(关键点) 1,网络结构,实现步骤概览 1,RCNN 网络结构 实现步骤 2,Overfeat 网络结构 3,SPP-Net 网络结构 2,各网络缺点 3,创新思路 3. ...

  7. 帮我写一篇外骨骼文献综述

    好的,我可以帮助您写一篇外骨骼文献综述. 外骨骼是一种外科器械,可以支撑和提高人体的力量和灵活性.它的历史可以追溯到20世纪初,但随着科技的不断发展,现代外骨骼已经发生了显著的改进. 近年来,外骨骼的 ...

  8. TCGA收官之作—27篇重磅文献绘制“泛癌图谱”

    TCGA的关键数字:图片来源<细胞> 由美国政府发起的癌症和肿瘤基因图谱(Cancer Genome Atlas,TCGA)计划于2006年联合启动,目前已经收录了来自1万多例病人的33种 ...

  9. 历时四个月整理一百篇博客的收获(毕业快乐)

    [辰兮要努力]:hello你好我是辰兮,很高兴你能来阅读,昵称是希望自己能不断精进,向着优秀程序员前行! 博客来源于项目以及编程中遇到的问题总结,偶尔会有读书分享,我会陆续更新Java前端.后台.数据 ...

最新文章

  1. JavaScript语言基础5
  2. 学python能赚什么外卖-python爬取外卖
  3. java中定时器的使用
  4. 天体运行动图,如此美妙,如此震撼!
  5. textract安装使用
  6. canvas的getImageData和putImageDataAPI
  7. 【玩味西班牙】之一:初识餐前小吃——达帕斯(TAPAS)
  8. 开源贡献 计算_现在贡献开源的3个理由
  9. MEME将于4月12日推出V2版本
  10. 如何使用无线连接来使Android调试手机
  11. 小敏同学利用计算机设计,福建省晋江一中、华侨中学2015-2016学年七年级数学上学期期中质量检测试题(无答案) 华东师大版...
  12. zeromq源码分析笔记之架构
  13. C语言的那些小秘密之【内存分配】
  14. 两转变两服务器,两大服变鬼两老服制霸,《魔兽世界》怀旧免转结束后的服务器调查...
  15. 鸿蒙系统主题如何自定义,华为鸿蒙系统细节曝光 支持自定义选项
  16. 下载JDK8 JVM源码
  17. echart曲线图的使用
  18. 【Mysql】1366 - Incorrect string value: ‘\xE9\x92\xB1\xE7\x94\xB5‘
  19. html5指纹特效,小米11指纹特效很神奇这样设置
  20. 猿圈 题库_百度传课携手猿圈 接入题库及测评服务

热门文章

  1. 从腾讯朋友圈揭秘内部AI部门竞争关系,谁能像微信当年一样熬出头? By 微胖2017年11月10日 09:06 撰文 | 宇多田 在腾讯合作伙伴大会上,腾讯首席运营官任宇昕提出的「AI in All」
  2. 如何构建 FinTech 科学反欺诈体系|架构师实践日
  3. 【深度学习】caffe 中的一些参数介绍
  4. Visual Studio 2013开发 mini-filter driver step by step (5) - 读写文件
  5. [并发编程] - Executor框架#ThreadPoolExecutor源码解读03
  6. Spring-注入参数详解-[集合类型属性]
  7. CardView的那点事儿
  8. C++五子棋(七)——main函数以及项目总结
  9. als算法参数_Spark2.0协同过滤与ALS算法介绍
  10. 语音识别2:CTC对齐的算法