1、参数检验和非参数检验的区别

  1. 定义不同:
  • 参数检验:假定数据服从某分布(一般为正态分布),通过样本参数的估计量(x±s)对总体参数(μ)进行检验,比如t检验、u检验、方差分析。
  • 非参数检验:不需要假定总体分布形式,直接对数据的分布进行检验。由于不涉及总体分布的参数,故名「非参数」检验。比如,卡方检验。
  1. 衡量值不同
  • 参数检验的集中趋势的衡量为均值
  • 非参数检验为中位数。
  1. 需要的信息不同
  • 参数检验要利用到总体的信息(总体分布、总体的一些参数特征如方差),以总体分布和样本信息对总体参数作出推断;
  • 非参数检验不需要利用总体的信息(总体分布、总体的一些参数特征如方差),以样本信息对总体分布作出推断。
  1. 适用范围不同
  • 参数检验只适用于变量,而非参数检验同时适用于变量和属性。
  • 参数检验只能用于等距数据和比例数据,非参数检验主要用于记数数据。也可用于等距和比例数据,但精确性就会降低。
  1. 测量两个定量变量之间的相关程度不同
  • 参数检验用Pearson相关系数
  • 非参数检验用Spearman秩相关。
  1. 假设不同
  • 参数检验是针对参数做的假设,非参数检验是针对总体分布情况做的假设,这个是区分参数检验和非参数检验的一个重要特征。
  • 非参数检验往往不假定总体的分布类型,直接对总体的分布的某种假设(例如如称性、分位数大小等等假设)作统计检验。拟合优度检验也是非参数检验。除了拟合优度检验外,还有许多常用的非参数检验。最常见的非参数检验统计量有3类:计数统计量、秩统计量、符号秩统计量。
  1. 适用条件不同
  • 正态分布用参数检验
  • 非正态分布用非参数检验

简而言之,若可以假定样本数据来自具有特定分布的总体,则使用参数检验。如果不能对数据集作出必要的假设,则使用非参数检验。

2、参数检验和非参数检验的优缺点

  1. 参数检验:
  • 优点:能充分利用提供的信息,统计分析的效率较高;
  • 缺点:对样本所对应的总体分布有比较严格的要求,这样就限制了它的适用范围,如等级数据、非确定数据(>50mg)不能使用参数检验,而且要求资料的分布型已知和总体方差相等。
  1. 非参数检验:
  • 优点:
    (1)应用范围广、简便、易掌握;
    (2)对总体分布未做出任何假定,因此适用于任何分布的资料,如严重偏态分布、分布不明的资料、等级资料或末端无确定数值的资料;
    (3)易于收集资料、统计分析比较简便
  • 缺点:不直接分析原始测量值,从而有可能会降低它的检验效率;若对符合参数检验条件的资料用非参数检验,则检验效率低于参数检验。

如无效假设是正确的,非参数法与参数法一样好,但如果无效假设是错误的,则非参数检验效果较差,如需检验出同样大小的差异的差异往往需要较多的资料。另一点是非参数检验统计量是近似服从某一部分,检验的界值表也是有近似的(如配对秩和检验)因此其结果有一定近似

参考链接1:http://blog.sina.com.cn/s/blog_4909aecd0102v49k.html
参考链接2:https://www.med66.com/web/gonggongweishenglilunzhishi/zf1505271926.shtml

3、非参数检验适用场景

(1)等级顺序资料。
(2)偏态资料。当观察资料呈偏态或极度偏态分布而有未经变量变换,或虽经变量变换但仍未达到正态或近似正态分布时,宜用非参数检验。
(3)未知分布型资料
(4)要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。
(5)初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)
(6)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可

4、非参数检验的常见方法

  1. Wilcoxon Signed Ranks test:也称配对符号秩检验,适用于连续型资料,用来检验配对资料的差值是否来自于中位数为0的总体,也可推断总体中位数是否等于某个指定值,该方法利用配对资料差值大小的信息,检验效率高于符号检验。
  1. Signtest:也称差数秩检验,根据配对资料差值正负号检验其效果有无差异,由于检验效能较低,当配对设计资料不满足非参数检验时可考虑使用。
  1. McNemar test:在卡方检验时学习过,该方法适用于计数资料,指标变量为二分类,可用来检验配对设计资料处理前后的结果是否存在差异或者配对组之间的频率有无差异。
  1. Marginal Homogeneity test:McNemar检验的扩展,适用于指标变量为多分类的有序或无序资料,即平方表格资料(R×R列联表资料)。



图片链接:https://blog.csdn.net/weixin_39771987/article/details/109906242

5.1、参数检验:检验回归(regression)、比较(comparison)或相关(correlation)三种关系

5.1.1 回归系数检验

回归系数检验用于检验/测试样本数据的变量之间因果关系,即自变量对因变量的影响是否显著。这种方法通常可以寻找到一个或多个连续变量对另一个变量的影响。三种回归系数检验方法使用条件及实例如下:

5.1.2 比较检验

比较检验是用来寻找群体平均数之间的差异。这种方法可以用来检验/测试定性(分类)变量对其他特征均值的影响。

在比较两组的平均值(例如男性和女性的平均身高)时,一般使用T检验。当比较两个以上组(例如儿童、青少年和成人的平均身高)的平均值时,使用方差分析和方差分析检验。

四种比较检验方法使用条件及实例如下:

5.1.3 相关性检验

相关性检验(Correlation Test)是对变量之间是否相关以及相关的程度如何所进行的统计检验,主要用来检查/测试两个变量是否相关,而不假设因果关系。

相关性检验一般是对两个或多个具备相关性的变量进行分析,从而衡量变量的相关密切程度。相关性的变量之间需要存在一定的联系或者概率才可以进行相关性检验。

相关性检验方法使用条件及实例如下:

5.2、非参数检验

非参数检验(Nonparametric tests) 针对的是总体分布不易确定,或分布呈明显偏态、方差不齐又无适当的变量转换方法以满足参数检验条件的样本数据。

需要注意的是:非参数检验的是比较分布而不是比较参数。非参数检验的方法是五花八门,名字也是千奇百怪,但是,这些方法有它们的共性。上面介绍了,就是因为对总体的分布形态不清楚或总体分布不是正态分布,所以无法用参数检验来推断总体的集中趋势和离散程度的参数。非参数检验不会对样本数据做太多的假设,当进行一个或多个常见的统计假设时,那么非参数检验是有用的。然而,从统计学上来讲,非参数检验的推论结果并不像参数检验那么有力。

三种不同的分布,右(左)偏态/负(正)偏态适合用非参数检验,正态分布适合用参数检验

非参数检验方法使用条件及替代的参数检验方法如下:

参考链接:统计分析到底该用参数检验?还是非参数检验?

数据分析之参数检验与非参数检验相关推荐

  1. 回归和拟合有什么不同-(非)参数检验-假设检验

    目录 1.回归和拟合的区别 2.参数检验和非参数检验的区别 3.假设检验 1.回归和拟合的区别 回归是拟合的一种方法,拟合的概念更为广泛,包括回归.插值和逼近. 回归强调存在随机因素,而拟合没有.拟合 ...

  2. 关联规则、支持度(support)、置信度(confidence)

    关联规则 关联规则:用于表示数据内隐含的关联性 Support(支持度):表示同时包含A和B的事务占所有事务的比例.如果用P(A)表示使用A事务的比例,那么Support=P(A&B) Con ...

  3. 数据挖掘:探索性数据分析(EDA)

    数据挖掘:探索性数据分析(EDA) 一.什么是探索性数据分析 EDA (Exploratory Data Analysis),即对数据进行探索性的分析.充分了解数据,为之后的数据清洗和特征工程等提供想 ...

  4. 毕业论文数据分析方法分类汇总

    今天将常用的数据分析方法进行一个分类汇总说明,整理如下图: 1.基本描述统计 基本描述统计分析包括频数分析.描述分析.分类汇总:是对收集的数据进行基本的说明. 频数分析一般使用频数.百分比.饼图等形式 ...

  5. 不显示参数名_非参数检验 之 非参数卡方检验

    序曲 快要临近春节了,但持续一年之久的疫情还在继续,不知是否会影响到今年的春节回家之路.今天故以杜甫的思乡诗开头. 月夜忆舍弟 唐 杜甫 戍鼓断人行,边秋一雁声. 露从今夜白,月是故乡明. 有弟皆分散 ...

  6. 数据统计分析(SPSS)【2】

    1.以下哪个是常见的聚类分析方法? A.层次聚类 B.曲线估计聚类 C.回归聚类 D.以上都不对 2.已知一批独立随机样本服从正态分布,要检验这批随机样本的均值是否与某总体分布的均值相同,则需要采用: ...

  7. 宏基因组分析-基于组装

    一.介绍 宏基因组 ( Metagenome) 指特定环境下所有生物遗传物质的总和.它包含了可培养的和未可培养的微生物的基因.一般从环境样品中提取基因组DNA, 进行高通量测序,从而分析微生物多样性. ...

  8. 4、spss做多元线性回归

    回归一直是个很重要的主题.因为在数据分析的领域里边,模型重要的也是主要的作用包括两个方面,一是发现,一是预测.而很多时候我们就要通过回归来进行预测.关于回归的知识点也许不一定比参数检验,非参数检验多, ...

  9. R语言绘制箱线图并添加相关显著性

    箱线图(又称盒须图)通过绘制连续型变量的五数总括,即最小值.下四分位数(第25百分位数).中位数(第50百分位数).上四分位数(第75百分位数)以及最大值,描述了连续型变量 的分布. "它主 ...

  10. 统计学进阶之临床建立模型(一)

    概述 统计就是归纳和演绎的结合,induction & deduction. 归纳,就是从数据中寻找一般规律(或者一般模型),演绎就是在人为的假定下去得出推而广之的普适性结论. 常规的统计学是 ...

最新文章

  1. 【linux】Valgrind工具集详解(十四):Cachegrind(缓存和分支预测分析器)
  2. 计算机多媒体理论知识,计算机多媒体技术07311.doc
  3. JavaScript在发送ajax请求时,URL域名地址是使用绝对地址还是相对地址?什么是浏览器跨域访问操作,js如何实现?
  4. java中frame窗体星星坠落_java窗体绘漫天星星和月亮
  5. boost::remove_vertex用法的测试程序
  6. 求数列1/3到1/n之和
  7. 产品新人如何快速成长?
  8. Qt文档阅读笔记-Qt单元测试中模拟GUI事件
  9. 分别求两个整数的最大公约数和最小公倍数。_看不懂辗转相除法求最小公约数?以身相许那种哦!...
  10. linux mint 8812ac网卡,kali虚拟机连接无线网卡comfast cf-812AC(Realtek 8812BU芯片)(不支持wlan0mon)...
  11. mysql面试必会6题经典_经典sql面试题及答案第7期
  12. gege.fans上热搜背后是明星私域流量的折射
  13. cimage和gdi绘图效率比较_使用MFC CImage类和GDI+ Image加载并绘制PNG图片
  14. HTML5 新特性(2)--Canvas
  15. P2627 [USACO11OPEN]Mowing the Lawn G 题解(单调队列+dp)
  16. 这一年,我所阐释的Linux哲学
  17. 深度学习方法(十五):知识蒸馏(Distilling the Knowledge in a Neural Network),在线蒸馏
  18. 服务器——SSL/TLS协议信息泄露漏洞(CVE-2016-2183)修复办法
  19. 塔夫茨计算机科学,塔夫斯大学计算机科学博士专业详情及要求是怎样的?
  20. teamviewer一直验证账户_奇葩的Synchrony Bank ID验证过程(解锁Amazon Store Card)

热门文章

  1. 简单基于tun实现的用户态NAT64
  2. altium designer PCB各层介绍+添加多层+设置正/负片+设置层的网络标号
  3. 画PCB四层板细节总结
  4. 随机生成中文姓名,手机号,邮编,住址(Java)
  5. msp430是什么?
  6. matlab直方图均衡化代码
  7. c语言解一元二次方程虚根oj,OJ 1040 Problem J 求一元二次方程的根
  8. microhard p900数传配置方法
  9. ALFA缺陷检测软件外观检测自学习人工智能软件
  10. 鸿蒙与混沌的区别,混沌的近义词(混沌鸿蒙同义词)