bootstrap自采样目前广泛应用与统计学中,其原理很简单就是通过自身原始数据抽取一定量的样本(也就是取子集),通过对抽取的样本进行统计学分析,然后继续重新抽取样本进行分析,不断的重复这一过程N(大于500次以上)次,然后得到N个统计结果,然后进行区间分析,得到最终结果。


在既往文章中,我们已经介绍了《R语言使用BOOT重抽样获取cox回归方程C-index(C指数)可信区间(2)》,很多粉丝发信问怎么做logistic回归内部验证AUC可信区间,我这些天也查了一下资料,发现主要分为两种方法一种是对数据进行重抽样,然后算出每个数据的AUC然后求出可信区间,这种方法是不能绘制ROC的可信区间图的,另一种是对结果数据进行抽样,可以绘制ROC可信区间图,如上图。我打算这两种方法都介绍一下,给大家多一种选择把,继续使用我们的不孕症数据(公众号回复:不孕症,可以获得数据)

library(pROC)
bc<-read.csv("E:/r/test/buyunzheng.csv",sep=',',header=TRUE)


数据有8个指标,最后两个是PSM匹配结果,我们不用理他,其余六个为:
Education:教育程度,age:年龄,parity产次,induced:人流次数,case:是否不孕,这是结局指标,spontaneous:自然流产次数。
有一些变量是分类变量,我们需要把它转换一下

bc$education<-ifelse(bc$education=="0-5yrs",0,ifelse(bc$education=="6-11yrs",1,2))
bc$spontaneous<-as.factor(bc$spontaneous)
bc$case<-as.factor(bc$case)
bc$induced<-as.factor(bc$induced)
bc$education<-as.factor(bc$education)

本文为转载文章,全文地址如下:https://mp.weixin.qq.com/s?__biz=MzI1NjM3NTE1NQ==&mid=2247486291&idx=1&sn=a7c61aa3e886777b8d7f5f05c2bf1809&chksm=ea26eb4fdd5162592a5b56ef2bba6c489564d0207ca415fd829d435121829d5080e9ee9bca20#rd

Boot重抽样获取logistic回归内部验证AUC可信区间相关推荐

  1. R语言使用BOOT重抽样获取cox回归方程C-index(C指数)可信区间(2)

    bootstrap自采样目前广泛应用与统计学中,其原理很简单就是通过自身原始数据抽取一定量的样本(也就是取子集),通过对抽取的样本进行统计学分析,然后继续重新抽取样本进行分析,不断的重复这一过程N(大 ...

  2. stata进行logistic回归内部验证和外部验证

    我们既往已经介绍了使用Stata进行logistic回归绘制列线图并做内部验证,不少粉丝发信息问我怎么进行外部验证.今天我们来介绍一下,继续使用我们的不孕症数据(公众号回复:不孕症可以获得该数据).我 ...

  3. R语言构建logistic回归模型:WVPlots包PRTPlot函数可视化获取logistic回归模型的最优阈值、优化(precision、enrichment)和recall之间的折衷

    R语言构建logistic回归模型:WVPlots包PRTPlot函数可视化获取logistic回归模型的最佳阈值(改变阈值以优化精确度(precision.enrichment)和查全率(recal ...

  4. R语言绘制复杂抽样设计logistic回归限制立方样条图(RCS)

    最近很多人问怎么使用R语言绘制NHANES数据复杂抽样设计限制立方样条图(RCS),NHANES数据属于复杂抽样调查,涉及到抽样权重.不能按既往的RCS绘制方法来绘制. 今天来演示一下,我手头上并没有 ...

  5. R语言glm拟合logistic回归模型:模型评估(模型预测概率的分组密度图、混淆矩阵、准确率、精确度、召回率、ROC、AUC)、PRTPlot函数获取logistic模型最优阈值(改变阈值以优化)

    R语言glm拟合logistic回归模型:模型评估(模型预测概率的分组密度图.混淆矩阵.Accuray.Precision.Recall.ROC.AUC).PRTPlot函数可视化获取logistic ...

  6. R语言机器学习mlr3:嵌套重抽样

    获取更多R语言和生信知识,请关注公众号:医学和生信笔记. 公众号后台回复R语言,即可获得海量学习资料! 目录 嵌套重抽样 进行嵌套重抽样 评价模型 把超参数应用于模型 嵌套重抽样 既有外部重抽样,也有 ...

  7. logistic回归模型—基于R

    logistic回归模型-基于R 数据理解和准备 一. 对缺失值的处理 二.虚拟变量的赋值 三.箱线图 四.相关性分析 训练集与测试集的划分 模型构建与评价 一.logistic回归模型 二.检查模型 ...

  8. 过拟合与模型调优(part2)--重抽样技术

    学习笔记,仅供参考,有错必纠 PS : 本BLOG采用中英混合模式,有些英文下有中文翻译 文章目录 重抽样技术 k折交叉验证 重复训练/测试集划分 Bootstrap方法 重抽样技术 Generall ...

  9. R语言进行复杂抽样设计(Survey-Weighted)logistic回归列线图-Cindex-ROC-校准曲线绘制-外部验证

    列线图,又称诺莫图(Nomogram),它是建立在回归分析的基础上,使用多个临床指标或者生物属性,然后采用带有分数高低的线段,从而达到设置的目的:基于多个变量的值预测一定的临床结局或者某类事件发生的概 ...

  10. 手动绘制R语言Logistic回归模型的外部验证校准曲线(Calibration curve)(2)

    校准曲线图表示的是预测值和实际值的差距,作为预测模型的重要部分,目前很多函数能绘制校准曲线. 一般分为两种,一种是通过Hosmer-Lemeshow检验,把P值分为10等分,求出每等分的预测值和实际值 ...

最新文章

  1. sdr 软件_SDR 软件定义的无线电
  2. qs.stringify和JSON.stringify的使用和区别
  3. Spark 101:它是什么,它做什么以及为什么起作用
  4. EASYUI+MVC4通用权限管理平台
  5. 项目记录:solr4.2 在tomcat7 的两种(singlecore + multicore) 配置安装 及solrj 的初步使用...
  6. MySQL千万级大表优化解决方案
  7. Python变量和字符串详解
  8. centos mysql gui_mysql gui
  9. python的wget用法介绍_Python使用wget实现下载网络文件功能示例
  10. 继电器(Relay)
  11. 系统分析师 考试大纲
  12. 辽宁省赛2010 G - NEW RDSP MODE I【思路题】(省赛选拔赛之个人赛9)
  13. datagrip 导出数据库表结构
  14. python飞机大战概要设计_飞机大战大学课程设计初稿.doc
  15. 视频教程-Python数据分析(统计分析)视频教程-机器学习
  16. 实验五 对等网的组建--自我操作
  17. Linux系统性能监控分析工具perf
  18. 软件测试——测试报告与验收
  19. 中国科学院计算机网络信息中心科学数据中心,中科院计算机网络信息中心简介...
  20. React之mobx、mobx-react 入门

热门文章

  1. 什么是小规模纳税人、小型微利企业、小微企业
  2. 【质量管理】SMT电子厂超实用的六西格玛(6σ)质量管理工具一览表!
  3. jquery || 检测已输入字数
  4. 因式分解用python写程序_使用Python实现质因式分解算法
  5. 儿童摄影HTML实现
  6. @ApiOperation
  7. 用命令提示符打开MySQL并编译sql语句
  8. SQLServer 大容量导入导致死锁和系统变慢问题
  9. 慕课网翁恺老师《面向对象程序设计——Java语言》第一周课程笔记及作业题(设计一个表示分数的Fraction类)
  10. 借助echarts制作酷炫3d地球动画