Author:ZHANG TAO
Data:2018.4.3

student t-test假设检验

χ2−χ2−\chi^2-distribution

设X1,X2,...,XnX1,X2,...,XnX_1,X_2,...,X_n是来自总体N(0,1)N(0,1)N(0,1)的样本,则称统计量

χ2=X21+X22+...+X2nχ2=X12+X22+...+Xn2

\chi^2 = X_1^2+X_2^2+...+X_n^2
服从自由度为n的卡方分布,记为 χ2(n)χ2(n) \chi^2(n)

t−t− t-distribution

设X∼N(0,1),Y∼χ2(n)X∼N(0,1),Y∼χ2(n)X \sim N(0,1),Y \sim \chi^2(n),并且X和Y独立,则称随机变量

t=XY/n−−−−√t=XY/n

t = \frac{X}{\sqrt {Y/n}}
服从自由度为n的t分布,记作 t∼t(n)t∼t(n)t \sim t(n)

t-test

One-sample

样本方差σ2σ2\sigma^2未知,关于μμ\mu的检验(t检验)

构造

t=X¯¯¯¯−μ0S/n−−√∼t(n−1)t=X¯−μ0S/n∼t(n−1)

t=\frac{\overline X-\mu_0}{S/\sqrt{n}} \sim t(n-1)

作为检测统计量,如果观测值过大就拒绝H0H0H_0

P{当H0为真时拒绝H0}=Pμ0{|X¯¯¯¯−μ0S/n−−√|≥k}=αP{当H0为真时拒绝H0}=Pμ0{|X¯−μ0S/n|≥k}=α

P\{当H_0为真时拒绝H_0\} = P_{\mu_0}\{ |\frac{\overline X-\mu_0}{S/\sqrt{n}}|\ge k\} = \alpha

如图1可知,当H0H0H_0为真时,监测统计量位于阴影部分的概率时αα\alpha(显著性水平,特别小的值),所以如果此事发生(也就是检测统计量的值位于阴影处时),就可以认为原假设时错误的,而拒绝H0H0H_0

问题1:matlab中的ttest返回的p_value表示的含义?

returns the p-value, i.e., the probability of observing the given result, or one more extreme,
by chance if the null hypothesis is true.  Small values of P cast doubt on the validity of the
null hypothesis.

形象的表示就是如图二所示,观测变量的值求出以后,红的区域的值就是P的value,而只有Pvalue<αPvalue<αP_{value}时才会拒绝原假设。

假设检验的难点在于如何通过已知量构造已知分布的检验统计量

Paired sample

一般,假设有n对相互独立的观察结果:(X1,Y1),...,(Xn,Yn),(X1,Y1),...,(Xn,Yn),(X_1,Y_1),...,(X_n,Y_n),另D1=X1−Y1,D2=X2−Y2,...,Dn=Xn−Yn,D1=X1−Y1,D2=X2−Y2,...,Dn=Xn−Yn,D_1=X_1-Y_1,D_2=X_2-Y_2,...,D_n=X_n-Y_n,则D1,D2,...,DnD1,D2,...,DnD_1,D_2,...,D_n相互独立。又因为D1,D2,...,DnD1,D2,...,DnD_1,D_2,...,D_n是由同一个因素引起的,所以可以认为他们服从同一个分布。故:

H0:μD=0,H1:μD≠0H0:μD=0,H1:μD≠0

H_0:\mu_D=0,H_1:\mu_D \ne 0
则检测统计量为:

t=|d¯¯¯sD/n−−√|∼t(n−1)t=|d¯sD/n|∼t(n−1)

t = | \frac{\overline d}{s_D/\sqrt{n}} | \sim t(n-1)

matlab实现使用ttest:

ttest  One-sample and paired-sample t-test.

Unpaired(Independent) sample

检验具有相同方差的两正态总体均值差的假设.假设X1,X2...Xn1X1,X2...Xn1X_1,X_2...X_{n_1}是来自分布N(μ1,σ2)N(μ1,σ2)N(\mu_1,\sigma^2)的样本,Y1,Y2,...,Yn2Y1,Y2,...,Yn2Y_1,Y_2,...,Y_{n_2}是来自正态总体N(μ2,σ2)N(μ2,σ2)N(\mu_2,\sigma^2),且设两样本独立。

H0:μ1−μ2=σ,H1:μ1−μ2≠σH0:μ1−μ2=σ,H1:μ1−μ2≠σ

H_0 : \mu_1-\mu_2=\sigma,H_1:\mu_1-\mu_2 \ne \sigma

t=(X¯¯¯¯−Y¯¯¯¯)−σSw1n1+1n2−−−−−−√,其中S2w=(n1−1)S21+(n2−1)S22n1+n2−2t=(X¯−Y¯)−σSw1n1+1n2,其中Sw2=(n1−1)S12+(n2−1)S22n1+n2−2

t = \frac{(\overline X-\overline Y)-\sigma}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}, \\ 其中S_w^2 = \frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}
易知:

t∼t(n1+n2−2)t∼t(n1+n2−2)

t \sim t(n_1+n_2-2)

matlab中实现时使用ttest2

ttest2默认是X和Y的方差时相等的,可以通过Vartype:unequal改成方差不相等。

'equal' Conduct test using the assumption that x and y are from normal distributions with unknown but equal variances.
'unequal'   Conduct test using the assumption that x and y are from normal distributions with unknown and unequal variances. This is called the Behrens-Fisher problem. ttest2 uses Satterthwaite's approximation for the effective degrees of freedom.
Vartype must be a single variance type, even when x is a matrix or a multidimensional array.Example: 'Vartype','unequal'

不相等的情况下被称为Behrens-Fisher problem,优化方式可参看wiki

MATLAB ttest和ttest2的区别相关推荐

  1. Matlab中(),[],与{}的用法区别

    在matlab中,常常会遇到(),[],和{},这3种符号,有时候就比较迷糊,这里总结一下,供参考. 一.圆括号( ) 使用方法 1.圆括号常常跟在数组后,里面是数组的下标,来访问数组元素. 例如:A ...

  2. matlab里H是什么,matlab 中 hObject和handles区别

    h:指回调函数被调用对象的句柄:handles:是包含GUI中所有组件句柄的结构体,该结构体的域名由对象的TAG属性定义.也可以用来传递数据给其他的回调函数和主程序. 例如:创建一个包含button的 ...

  3. matlab的imshow, image, imagesc区别

    转载自:https://www.cnblogs.com/liuke-note/p/10149631.html 1.显示RGB图像 相同点:这三个函数都是把m*n*3的矩阵中的数值当做RGB值来显示的. ...

  4. matlab整型和浮点的区别,技术帖 | 心理学MATLAB初学者教程--简单数据类型介绍(逻辑型数据,整型/浮点型数据,字符型)......

    1.2.1 什么是变量和变量名 变量这个词似乎在许多地方都有出现,在计算机中变量是指是一段有名字的连续存储空间(摘自百度百科),而这个所谓的名字就叫做变量名.举个例子说现在我们再MATLAB的命令窗口 ...

  5. matlab rem与mod 的区别

    二者均有取余数的含义,区别在于近似的方式不同,或者更具体地说,是 fix 和 floor 在取整方式上的不同. mod b = mod(a,m) 等价与 b = a - m.*floor(a./m)% ...

  6. matlab中 mcc/mbuild/mex 区别

    mcc 的作用是将 .m文件编译为 c/c++动态链接库文件,使你可以在 c/c++程序中使用 matlab的一些函数功能.mcc 也可以将.m文件编译为exe可执行文件. mex 的作用是将 c/c ...

  7. matlab中(),[],与{}的使用区别

    在matlab中,常常会遇到(),[],和{},这个3种符号怎么区分,怎么用,这里我来总结一下,供参考. [] 首先.[]叫中括号,它用来存储矩阵和向量(vector在C++中也叫容器)  举个例子, ...

  8. MATLAB中newff新旧区别

    今天为了创建一个BP网络,于是使用newff函数,因为目前现在的matlab支持新的newff函数,如果继续使用旧的newff函数会导致warning,而且新的newff函数有很多方便之处. 首先,函 ...

  9. matlab svd 和 eig 的区别

    转自: https://my.oschina.net/duluo180/blog/736587 总得来说,SVD eig 得到的特征值/奇异值是一样的,eig排列是降序,svd排列是升序: SVD的右 ...

  10. matlab conv2 和filter2的区别

    MATLAB中提供了卷积运算的函数命令conv2,其语法格式为: C = conv2(A,B) C = conv2(A,B)返回矩阵A和B的二维卷积C.若A为ma×na的矩阵,B为mb×nb的矩阵,则 ...

最新文章

  1. 刨根问底,Kafka消息中间件到底会不会丢消息
  2. 芯片、模组、开发板的区别与联系-结合ESP32浅谈(转载)
  3. 动物界的再生一个故事
  4. MyEclipse-7.5.0版注册码破解及激活操作
  5. datatable 多字段 排序;
  6. 加州大学惊现神操作!物理教授用数学论文摆脱400美元交通罚单,却惨被网友大反转.........
  7. mysql上传到阿里云服务器地址_从0部署Web项目到阿里云服务器上
  8. EMNLP 2021 | 论辩挖掘在不同领域下的应用
  9. houseprice_analysis_广州房子租售比分析(上)
  10. 项目实战:十种方法实现图像数据集降维
  11. python 解析 google Chrome 浏览器历史浏览记录以及收藏夹数据
  12. Lombok之@Cleanup使用
  13. 键值数据库的基本架构
  14. 2020年acm计算机比赛时间,最新!2020年五大学科竞赛时间安排汇总(建议收藏)...
  15. 再见PanDownload ,下一个已经来了。
  16. NETDMIS5.0笛卡尔坐标系和矢量2023
  17. 解决加载高德地图闪白框及logo问题
  18. 三维点云数据集汇总(分类+检测+识别)
  19. 2020年中国分子诊断行业发展现状分析,行业应用领域不断拓展,发展前景广阔「图」
  20. 频谱扩展 matlab,使用MATLAB进行频谱分析

热门文章

  1. guass-jordan消元法求逆的原理
  2. time库:Python的时间时钟处理
  3. 修改html颜色代码,JavaScript实现更改网页背景与字体颜色的方法
  4. N卡所有旧版本驱动下载(2021年6月3日测试可用版)
  5. 西工大计算机学院导师赵歆波,黎永前_西北工业大学研究生导师信息
  6. 关于Egret项目升级引擎出现的问题
  7. VMware虚拟机安装macOS黑苹果教程,亲测流程,全过程问题解决方案记录
  8. Industry工业软件开发平台设计A-1
  9. ArcGIS裁剪影像如何保持裁剪完全一致
  10. 音频驱动不支持您的计算机硬件,声卡驱动装不上导致电脑没声音怎么办?