论文题目:RANDOM SURVIVAL FORESTS

论文PDF链接:

https://arxiv.org/pdf/0811.1645.pdf​arxiv.org

简介:随机生存森林(RSF),是一种用于对右删失生存数据进行分析的随机森林方法。 它引入了用于生长生存树的新生存分裂规则,以及用于估算缺失数据的新缺失数据算法。

RSF引入了生存森林的事件保留原则,并将其用于定义总体死亡率,这是一种简单的可解释的死亡率度量,可以用作预测结果。R软件包randomSurvivalForest提供了使用接口。

一、背景

基于决策树为基础学习器来构建集成模型,可以大大提高预测性能。 Breiman(2001)表明,可以通过将随机化注入基础学习过程中来进一步改善集成学习,这种方法称为随机森林。随机生存森林(RSF)方法扩展了Breiman的随机森林(RF)方法。在RF中,随机化有两种形式。首先,使用数据的随机样本子集样本来生长一棵树。其次,在树的每个节点上,选择随机选择的特征变量子集(协变量)作为分割的候选变量。对所有树进行平均,再结合用于生长树的随机化,可使RF功能更加丰富,同时保持较低的泛化误差。大量的经验证据表明,RF具有很高的准确性,可与诸如bagging[Breiman(1996)],boosting[Schapire等。 (1998)]和支持向量机[Cortes and Vapnik(1995)]等方法相提并论。

到2008年为止,RF的应用主要集中在分类和回归问题上。R软件包randomForest [Liaw and Wiener(2002,2007)]也仅考虑回归和多类数据设置,而不考虑生存分析。将随机森林扩展到右删失的生存数据具有很大的价值。通常使用依赖限制性假设(例如比例风险)的方法来分析生存数据。此外,由于这些方法通常是参数化的,因此必须通过特定形式的转换函数来表述非线性的效应。通常采用逐步回归等方法来确定非线性效应,但是涉及到多变量协同非线性时,这样会有一定问题,只能通过穷举方法或主观知识缩小搜索范围。

相反,这些困难是使用RF可以自动处理的。文章通过对体重过轻,超重或肥胖以及患有严重但稳定的冠状动脉疾病的预后意义进行深入的案例研究,来说明RSF可以轻松发现复杂的数据结构。尽管有关肥胖病流行的公共卫生影响已经有很多报道[Olshansky et al.(2005)],关于体重与预后的精确关联存在相当大的争议。调查人员注意到,体重过轻的人可能发生反向因果关系,与吸烟的相互作用以及拐点不明确的复杂模式,在这一点上体重增加会增加风险[Adams等(2006),Flegal(2005、2007),Fontaine等人(2003)]。一些人已经确定了心脏病患者中可能存在的肥胖悖论,其中体重增加预示着更好的生存[Urtesky等。 (2007)]。为了弄清这些问题,文章分析了接受隔离冠状动脉搭桥手术的一大批冠心病患者。使用RSF,我们确定了长期生存,体重,肾功能,吸烟和通过皮瓣移植的冠状动脉内部数目之间的复杂关系。RSF有助于解释先前报道的一些明显矛盾。

其他森林方法:RSF严格遵守Breiman(2003)提出的规定,因此不同于其他森林生存数据方法。 Breiman的处方要求在种植随机森林的各个方面都考虑到结果。 在右删失的生存设置中,这包括生存时间和检查状态。 因此,用于生长树的分裂准则必须明确地涉及生存时间和删失信息。 树节点杂质,测量分割数据的有效性,必须通过生存差异来测量分离。 此外,对于树中的终端节点的预测值,从森林中得到的整体预测值以及预测准确性的度量都必须适当地包含生存信息。

随机效应估算与固定效应估算_【机器学习】随机生存森林相关推荐

  1. 随机效应估算与固定效应估算_固定效应模型的估计原理说明.pdf

    固定效应模型的估计原理说明 在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是 模型的截距项是不同的,而模型的斜率系数是相同的,则称此模型为固定效应模 型.固定效应模型分为三类: 1. ...

  2. 随机效应估算与固定效应估算_固定效应模型及估计原理说明.doc

    . . 固定效应模型的估计原理说明 在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,则称此模型为固定效应模型.固定效应模型分为三类: ...

  3. 时间固定效应和个体固定效应的选择_互助问答第31期:固定效应与随机效应选择和面板数据处理...

    样本描述:各位老师好,我的论文采用的是微观面板非平衡数据(合并了3波数据,总观测值6万左右),每波观测之间约有20%的样本不同(约10%的样本流失,10%的新样本补入),因变量是连续变量,核心自变量是 ...

  4. R语言线性混合效应模型(固定效应随机效应)和交互可视化3案例

    最近我们被客户要求撰写关于线性混合效应模型的研究报告,包括一些图形和统计输出. 视频:线性混合效应模型(LMM,Linear Mixed Models)和R语言实现案例 线性混合效应模型(LMM,Li ...

  5. 随机效应估算与固定效应估算_一般混合线性模型固定效应、随机效应与另一随机向量的联合估计...

    一般混合线性模型固定效应.随机效应与另一随机向量的 联合估计 周永正 [期刊名称] <数学的实践与认识> [年 ( 卷 ), 期] 2011(041)019 [摘要] 讨论一般混合线性模型 ...

  6. R语言非线性混合效应 NLME模型(固定效应随机效应)对抗哮喘药物茶碱动力学研究

    最近我们被客户要求撰写关于非线性混合效应 NLME模型的研究报告,包括一些图形和统计输出. 相关视频:线性混合效应模型(LMM,Linear Mixed Models)和R语言实现 线性混合效应模型( ...

  7. 时间固定效应和个体固定效应的选择_固定效应模型必须同时控制时间和个体吗?...

    固定效应模型fixed effects model的存在是为解决这个经典的内生性问题,即time invariant (不随时间变化的)的内生性问题存在于每个单个样本中,所以解决方式是控制单个样本.t ...

  8. 时间固定效应和个体固定效应的选择_STATA固定效应的时间固定和个体固定效应估计方法、检验策略和操作步骤...

    STATA固定效应的时间固定和个体固定效应估计方法.检验策略和操作步骤 最近在研究空间动态面板模型,其中涉及到固定效应模型要确定时间固定和个体固定效应时,由于在stata中使用,查阅了很多文献最终攻克 ...

  9. Stata:面板数据,一般加上个体固定效应和时间固定效应

最新文章

  1. setTimeout和setInterval实现定时器的区别
  2. ai3中文语音补丁_NS 暗黑破坏神3 中文补丁今日上线!刷起来
  3. Linux系统的目录绑定配置
  4. tf.data.Dataset 用法
  5. JPA中实现单向多对一的关联关系
  6. 计算道路超高lisp_5G+AI超高清智能视频监控将迎来增长期
  7. 盘一盘推荐系统里值得一读的那些论文
  8. 算法训练营09-深度优先和广度优先
  9. JPA的继承 OOD和关系数据库的 纽带
  10. Win10 Composer下载安装
  11. 现代大学英语精读第二版(第四册)学习笔记(原文及全文翻译)——3A - Groundless Beliefs(无根据的信念)
  12. D3DTOP_DOTPRODUCT3的计算公式
  13. Rod-cutting(动态规划)
  14. Simulink自动代码生成5——控制函数原型(control function prototype)
  15. 圣天诺LDK能做什么?
  16. 解压oracle 失败,CentOS5.9 安装oracle 11g 遇到的各种问题
  17. 帝国霸业服务器无限加载,帝国霸业银河生存控制台的服务器命令是什么_控制台服务器命令一览_3DM单机...
  18. 通用U盘启动盘制作工具 V5.0(全能版)
  19. Ubuntu20版-阿里源
  20. ElasticSearch重启失败的解决方案

热门文章

  1. Python判断两个单词的相似度
  2. ubuntu安装eclipse java环境变量配置_【Linux学习】Ubuntu下安装JDK以及配置环境,和eclipse的下载...
  3. HTML引用外部css 、js的路径
  4. 基于MVC的jpetstore项目分析
  5. 32位系统安装oracle11g,windows系统下 32位 安装Oracle 11g R2(11.2.0.1.0)图文安装教程
  6. mock如何为空_Mockito怎么样Mock返回值为空的方法
  7. textfield获取其中内容_冲压工艺流程,常见冲压缺陷及消除方法,46页内容全面介绍冲压...
  8. OpenCV4每日一练day1:VS2015+opencv4.1.0+读图测试
  9. C++之构造函数、(构造)函数重载探究
  10. java的printwriter_Java PrintWriter错误