数据分析的统计方法选择小结(变量之间的关联性分析)

一、两个变量之间的关联性分析

1.两个变量均为连续型变量

1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析

2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析

2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析

3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析

二、回归分析

1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。

2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。

1)非配对的情况:用非条件Logistic回归

(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

2)配对的情况:用条件Logistic回归

(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用。

数据分析的统计方法选择小结(变量之间的关联性分析)相关推荐

  1. 统计方法选择思维导图(医学科研)

    统计方法选择思维导图-医学科研 一.统计方法的选择 1.1 单变量 1.2 双变量 1.3 多变量 二.建模思路 2.1 举例-多因素回归模型-建立 2.1.1变量整理和分类 2.1.2 单因素回归分 ...

  2. 病例对照研究中—两组组间比较—的统计方法选择,基于R语言

    医学中最常设计的试验就是病例对照研究,以探究某一干预措施是否有改善性.需要根据基线的情况,选择相应的方法. 试验数据如下: (声明:该数据是随机自动生成的,虚拟的,该计算结果不代表任何真实的事情,该数 ...

  3. 生存分析统计方法选择,可以避免的一些坑

    我们首先看看什么是生存分析? 因为无法在短时间内评价慢性病患者的预后,所以通常情况下不会简单地采用治愈率.病死率等指标,而是对患者进行随访,分析一定的时间之后患者生存或死亡的情况,这种将事件的结果和出 ...

  4. 两变量之间的相关性分析

    目录 0. 基本概念 1. 卡方检测 2. Eta系数 3. Pearson系数 (1) 适用条件 (2) 系数公式 (3) t检验 4. Spearman等级相关系数 (1) 适用情况 (2) 计算 ...

  5. Python的富比较方法__eq__和__ne__之间的关联关系分析

    Python的富比较方法包括__lt__.__gt__.__le__.__ge__.__eq__和__ne__六个方法,分别表示:小于.大于.小于等于.大于等于.等于和不等于,对应的操作运算符为:&l ...

  6. 啤酒与尿布?挖掘商品之间的关联性分析(1):机器学习之Apriori算法

    从这个贸易战看:强权即是真理,没有所谓的自由贸易和平等.中国之大已容不下一个安静的键盘.不过是又一次鸦片战争.除了愤怒还是愤怒,除了一心想为崛起而澎湃还是一心想为崛起而澎湃.中华文明三四千年的历史都是 ...

  7. python中lt方法_Python的富比较方法__lt__、__gt__之间的关联关系分析

    Python的富比较方法包括__lt__.__gt__分别表示:小于.大于,对应的操作运算符为:"".那么是否象普通数字运算一样,这两个方法之间存在互反的关系呢? Python没有 ...

  8. EMOTET,URSNIF,DRIDEXBitPaymer之间的关联性分析

    全文没几个字,阅读时间3秒 有力气可以推荐朋友关注一下,献出爱心拯救博主 EMOTET,URSNIF,DRIDEX和BitPaymer之间的联系  如图所示,左侧是共享诱饵文档,不共享混淆工具,右侧为 ...

  9. 气象统计方法期末知识点小结

    气象统计方法知识点小结 小知识点 气象统计诊断的基本步骤 资料收集 资料预处理 选取诊断方法 科学综合与诊断分析 气象统计预测的基本步骤 资料收集 选择合适的统计模型 统计检验 预测结论 一些概念 气 ...

最新文章

  1. R使用dplyr包对变量、特征进行标准化(standardize)缩放操作
  2. PNAS:张航课题组揭示人类为何“扭曲”概率信息
  3. 教你一招超级简单的方法快速搞定grub.conf文件的丢失及损坏
  4. WCF扩展:行为扩展Behavior Extension一
  5. 钉钉小程序封装请求地址
  6. C语言高级编程:C语言数据类型大小和取值范围
  7. 【ArcGIS遇上Python】ArcGIS Python实现Modis NDVI批量求年最大值
  8. 实现Windows程序的数据更新
  9. html button跳转页面_HTML跳转到页面指定位置的几种方法
  10. 百度在线编辑器 显示html,UEditor百度编辑器中JS/html代码(script标签)被过滤的解决办法...
  11. php 上传没生成文件,php-上传时无法创建临时文件
  12. 16种常用的数据分析方法-聚类分析
  13. 线下AWD平台搭建以及一些相关问题解决
  14. 爬虫抓图2022年全网最新方法,这一次终于是4k高清美图
  15. ubuntu镜像源的配置
  16. 抖音直播流量怎么来?四大渠道告诉你
  17. 【pytorch】|tensor grad
  18. 【LeetCode】1160. 拼写单词(C++)
  19. (2)ubuntu 中安装epics 的额外插件---asyn 以及 streamdevice
  20. 小几届的学弟问我,软件测试岗是选11k的华为还是20k的小公司,我直呼受不了,太凡尔赛了

热门文章

  1. 什么是DDoS攻击?企业服务器是否需要DDoS防御
  2. 教育期刊《数学大世界》期刊简介及投稿要求
  3. 为什么学会了结构化思维,还是不会沟通?
  4. cpu对各种运算的速度对比
  5. 2021-06-29 Views and Quality Objectives of Software Construction 软件构造的多维度视图和质量目标
  6. 【Bug解决】invalid argument at /pytorch/aten/src /THC/THCGeneral.cpp:405
  7. 弘辽科技:淘宝基础销量是什么?如何提升商品的基础销量?
  8. matlab测量硬币尺寸,MATLAB硬币定位
  9. 从立项到发布仅三个月,开源技术问答社区 Answer 是如何诞生的?
  10. “我顶你个肺”是什么意思?