模拟回归模型的数据

验证回归模型的首选方法是模拟来自它们的数据,并查看模拟数据是否捕获原始数据的相关特征。感兴趣的基本特征是平均值。我喜欢这种方法,因为它可以扩展到广义线性模型(logistic,Poisson,gamma,...)和其他回归模型,比如t -regression。这是Gelman和Hill在回归文本中的内容。1可悲的是,从R中回归模型模拟数据的默认方法错过什么人可能会考虑模型不确定性的一个重要来源-在估计回归系数的差异。

您的标准回归模型假设存在将预测变量与结果相关联的真实/固定参数。但是,当我们执行回归时,我们只估计这些参数。因此,回归软件返回表示系数不确定性的标准误差。在所有其他条件相同的情况下,较小的样本量导致我们更大的系数不确定性意味着更大 模拟模型数据的默认方法忽略了这种不确定性。这是一个大问题吗?也许不是那么多。但如果不忽视这种模型不确定性的来源,那就太好了。

我将用一个例子来证明我的意思。

示范

我将使用泊松回归来证明这一点。我模拟了两个预测变量,一个连续,xc和一个二进制,xb。并使用50的小样本。

library(MASS) # For multivariate normal distribution, handy later on
n <- 50
set.seed(18050518)
xc的系数为0.5 ,xb的系数为1 。我对预测进行取幂,并使用该rpois()<

R语言进行数值模拟:模拟泊松回归模型的数据相关推荐

  1. R语言caret包构建机器学习回归模型(regression model)、使用DALEX包进行模型解释分析、特征重要度、偏依赖分析等

    R语言caret包构建机器学习回归模型(regression model).使用DALEX包进行模型解释分析.特征重要度.偏依赖分析等 目录

  2. R语言使用broom包将回归模型(线性回归、逻辑回归、比例风险回归)的结果整理成dataframe并导出到excel等文件中:基于mtcars和colon数据集

    R语言使用broom包将回归模型(线性回归.逻辑回归.比例风险回归)的结果整理成dataframe并导出到excel等文件中:基于mtcars和colon数据集 目录

  3. R语言无序多分类Logistic回归模型实战

    R语言无序多分类Logistic回归模型实战 目录 R语言无序多分类Logistic回归模型实战 #导入包 #加载数据数据编码

  4. R语言基于glmnet构建Logistic回归模型使用L1正则化并可视化系数及最佳lambda值

    R语言基于glmnet构建Logistic回归模型使用L1正则化并可视化系数及最佳lambda值 Glmnet主要用于拟合广义线性模型.筛选可以使loss达到最小的正则化参数lambda.该算法非常快 ...

  5. R语言使用lm函数构建回归模型、使用broom包的augmented函数将模型结果存入dataframe中、使用ggplot2可视化回归残差图(拟合值和残差值的关系图)

    R语言使用lm函数构建回归模型.使用broom包的augmented函数将模型结果存入dataframe中.使用ggplot2可视化回归残差图(拟合值和残差值的关系图) 目录

  6. R语言使用lm函数构建回归模型、使用MASS包的boxcox函数寻找最佳幂变换提高模型拟合度、可视化boxcox曲线并获取最佳lambda值

    R语言使用lm函数构建回归模型.使用MASS包的boxcox函数寻找最佳幂变换提高模型拟合度.可视化boxcox曲线并获取最佳lambda值 目录

  7. R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算、估计(Propensity score)、预测倾向性评分并可视化不同分组倾向性评分的分布

    R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算.估计(Propensity score).预测倾向性评分并可视化不同分组倾向性评分的分布 目录

  8. R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算、使用predict函数预测倾向性评分并将结果整合到dataframe中

    R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算.估计(Propensity score).使用predict函数预测倾向性评分并将结果整合到da ...

  9. R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算、估计(Propensity score)

    R语言使用glm构建logistic回归模型,构建多个协变量和分组变量之间的关系模型进行倾向性评分计算.估计(Propensity score) 目录

最新文章

  1. 11位院士专家建言基础研究
  2. 基于机器学习的web异常检测
  3. 消费升级背景下零食行业发展报告_零食行业进入4.0时代,蔬菜、水果、肉制品站上万亿风口!...
  4. 分布式mysql一致性问题_分布式缓存数据库一致性问题
  5. shell脚本--cut命令
  6. 全国网络教育统考计算机应用基础题目精选,全国网络教育统考计算机应用基础题目精选解析.doc...
  7. [转] polymorphic databinding solutions
  8. 基于motion的视频压缩的实时监控系统
  9. 【工具】JAVA 在单元读取文件并比较
  10. db2数据库连接数 linux_DB2 数据库 linux基本操作【转】
  11. java中什么是实例化
  12. java判断名字是否为张三_现有5个学生{张三,李四,王五,那六,小七}的数组,输入一个姓名,检查姓名是否存在,如果java啊...
  13. 重装win10系统 远程控制TeamViewer——深度学习菜鸡入门(2)
  14. KNN算法原理与自实现电影分类
  15. mate 10android o主题,华为Mate 10 Pro体验:这才是全面屏手机该有的样子
  16. 网易面试是一种什么体验?
  17. Illustrator绘制时尚的圣诞老人插画教程
  18. CostMonitorUtils耗时监控工具类(线程安全)
  19. 图文讲解如何在outlook里设置绑定QQ企业邮箱教程
  20. 【Leetcode刷题】:Python:416. 分割等和子集

热门文章

  1. onlyoffice 收费不_OMG!你家小区物业有没有这些乱收费的现象……|物业|物业管理|物业服务|门禁卡|停车费...
  2. 触屏笔哪个牌子好用?高性价比的电容笔推荐
  3. Masking操作,即只关注图像的一部分
  4. (附源码)ssm小程序 实验室安全管理系统 毕业设计 031527
  5. Js年龄计算,精确到岁、月、小时
  6. 海边溺水,救援机器人“生死时速”;机器学习论文撰写清单;Kaggle数据科学新手教程;约克大学『计算机视觉』课程资料;前沿论文 | ShowMeAI资讯日报
  7. 华为路由TC7102实现一根网线分离同时支持路由器无线网络使用和电信IPTV机顶盒播放的方法步骤
  8. 世界各地 史上最全最详细无线通信频率分配表(内容含概wifi、2.4G、5G,绝对值得收藏)
  9. HDMI 4K分辨率 时序
  10. 隐私保护和数据安全:区块链的隐私问题、零钞:基于zkSNARK的完美混币池、Hawk:保护合约数据私密性、Coco框架、Baby Zoe