随机森林中的Bootstrap抽样是有放回抽样么?Bootstrap抽样过程描述一下

Bootstrap方法:每当选中一个元组,这个元组同样也可能再次被选中并再次添加到训练集中。例如,想象一台从训练集中随机选择元组的机器,在有放回的的抽样中,允许机器多次选择同一个元组。

有多种自助方法,最常用的是 .632自助法。方法如下:​假设给定的数据集包含d个元组,该数据集有放回的抽样d次,产生d个样本的自助样本集或训练集。原始数据元组中的某些元组很可能在该样本集中出现多次。没有进入该训练集的数据元组最终形成检验集。假设进行这样的抽样多次。其结果是:在平均情况下,63.2%原始数据元组将出现在自助样本中,而其他36.8%的元组将形成检验集。

“数字63.2%从何而来?”​每个元组被选中的概率是 1/d, 因此未被选中的概率是(1-1/d), 需要挑选 d 次,因此一个元组在 d 次都未被选中的概率是(1-1/d)^d。如果 d 很大,该概率近似为 e^(-1)=0.368。因此36.8%的元组将作为验证集。

可以重复抽样过程 k 次,其中在每次迭代中,使用当前的检验集得到从当前自助样本​得到的模型的准确率估计。模型的总体准确率则用下式估计

随机森林中的Bootstrap抽样是有放回抽样么?Bootstrap抽样过程描述一下相关推荐

  1. Kmeans聚类K值选择Parametric Bootstrap方法,以及数据重抽样方法Bootstrapping

    常用的K值选择方法是通过寻找"拐点"确认,或者下游业务需求确定.下文介绍了另一种选择方法. 评论:原始该K值选择法只有在数据为"gaussian-like"时才 ...

  2. 将森林转换为对应的二叉树,若在二叉树中,结点u时结点v的父结点的父结点,则在原来的森林中,u和v可能具有的关系是( )

    将森林转换为对应的二叉树,若在二叉树中,结点u时结点v的父结点的父结点,则在原来的森林中,u和v可能具有的关系是( ① ② ) ① 父子关系 ② 兄弟关系 ③ u的父结点与v的父结点是兄弟关系 森林与 ...

  3. bootstrap网格系统_如何使用Bootstrap网格系统?

    bootstrap网格系统 In the last article, we learned how to create a simple page of Bootstrap? Now, we will ...

  4. html遮罩层模态提示,页面遮罩层,并且阻止页面body滚动。bootstrap模态框原理,.bootstrap模态...

    页面遮罩层,并且阻止页面body滚动.bootstrap模态框原理,.bootstrap模态 实现思路: 1.需要有一个层将body遮住,放在body上方. 2.修改body的overflow属性值为 ...

  5. Bootstrap学习(三)——Bootstrap 插件

    Bootstrap学习(三)--Bootstrap 插件 Bootstrap 插件 Bootstrap 自带 12 种 jQuery 插件,扩展了功能,可以给站点添加更多的互动. 站点引用 Boots ...

  6. bootstrap学习笔记一: bootstrap初认识,hello bootstrap(下)

    这一篇主要是补上源码,开始之前请先回顾:bootstrap学习笔记一: bootstrap初认识,hello bootstrap(上) 首先,我们的页面要求, lang,charset等就不用说了,老 ...

  7. bootstrap使用方法以及创建bootstrap模板

    创建bootstrap项目 1.进入官网进行下载 Bootstrap v3 中文文档 · Bootstrap 是最受欢迎的 HTML.CSS 和 JavaScript 框架,用于开发响应式布局.移动设 ...

  8. python模拟支付宝蚂蚁森林的能量产生过程_支付宝蚂蚁森林中,哪些行为可以产生更多的能量?...

    支付宝作为一款第三方支付应用,几乎涵盖了半数的第三方支付市场.而随着支付宝功能的不断完善与更新,支付宝所产生的生态圈更是让用户紧紧地连接在了一起.比如在使用支付宝时,我们不仅可以将其当做线下移动支付的 ...

  9. python抽样_python数据预处理 :数据抽样解析

    何为数据抽样: 抽样是数据处理的一种基本方法,常常伴随着计算资源不足.获取全部数据困难.时效性要求等情况使用. 抽样方法: 一般有四种方法: 随机抽样 直接从整体数据中等概率抽取n个样本.这种方法优势 ...

最新文章

  1. Nginx负载均衡+tomcat+session共享
  2. 通过 vSphere WS API 获取 vCenter Datastore Provisioned Space 置备空间
  3. Redis常用命令之操作String类型
  4. 内核的Makefile与Kconfig关系解析
  5. IntelliJ IDEA 修改缓存文件设置
  6. Python组合数据类型:字典dictionary
  7. Git 提交错了不用慌,这三招帮你修改记录
  8. 2018年山西省环境空气质量综合指数平均下降10.8%
  9. oracle建表 和 设置主键自增
  10. HNUCM 1284:二叉树遍历
  11. JavaWeb-Servlet--day01(笔记)
  12. 用四位led数码管作显示器的篮球比赛24秒计时器求c语言代码,篮球比赛计时器的设计与实现...
  13. Xmind如何添加水印
  14. 学习如逆水行舟,只有坚持不断的学习,才能保持进步!我置顶了这些公众号
  15. 十字军之王3 mac中文版
  16. Win10 计算机扩展显示器闪黑屏
  17. 3.模板模式_1:什么是模板模式???什么情况适合用模板模式???模板模式如何实现???
  18. 国投瑞银创新基金对基金市场有何影响
  19. 学了python再学java要多久,有java基础学python要多久
  20. PTA 显示指定范围的素数并求和《越努力越幸运》

热门文章

  1. 双列集合,往treeMap里添加元素的时候注意的事项
  2. c# 实现二进制文件读写、ini文件读写以及一些文件和目录的常用操作,在某些特定情况下会用到,如录波文件要保存.dat
  3. matlab各名称,Matlab-Simulink各模块对应的中文名称及介绍
  4. python因数之和等于数字本身_python找出因数与质因数的方法
  5. 快速排序原理及代码模板
  6. C#利用Graphics类绘制进阶--实现图片等比例缩放
  7. 点云滤波/分割/关键点提取/配准/识别/重建教程
  8. 教你如何提高双目立体视觉系统的精度
  9. arcgis车辆轨迹动态_聪明反被聪明误 屏蔽车辆GPS被处罚
  10. React 项目--引入bebal 解析JSX(5)