不同分析问题需要使用的分析方法

集合之间平均值校验

集合之间平均值校验

变量关系比较

变量关系比较

变量关系比较

1 ~ 2 个的集合

多个集合(2个以上)

范畴型变量独立性校验

数值型变量间线性关系

一种数值型变量与N个变量间的关系

T-test(2个group,比如男女身高差)

ANOVA(eg.比较大学学科间考试成绩差的情况)

Chi Square

相关分析

回归分析

One sample T-test(e.g.肉的重量是否1kg)

Paired T-test(比如减肥前后,特定集合的前后比较)

Two sample T-test(比如比较男女身高的求两个集团的平均)

One way ANOVA (ANOVA有一个独立类型要素时使用一元分析,如求出家庭收入对食品消费程度的差异时使用)

Two way ANOVA(有两个独立要素时使用,比如考虑跟学历及性别有关的消费金额的差异;不在ds级别范围)

求一个因素的双侧检验

One Sample T Test

H0:体温等于97.7 H1:体温不等于97.7

统计某一列的均值等

Statistic Summary

对应的两个(同样/类似)集合差异比较,有before-after关系的验证

Paired T Test

如 各州10年间增加的犯罪平均是否是170(即10年后的数据-10年前的数据=170)

比较两个相互不同的独立group间的平均差异。

Two Sample T Test For Stacked Data

如 男女体温的平均是否有差异。

对立假设:

•男性平均体温与女性平均体温有差异

集合之间平均值校验,独立变量只有一个-

One Way ANOVA

T检验

T分布

用于根据小样本来估计呈正态分布且方差未知的总体均值。

t分布特征

(1)单峰分布,以0为中心,左右对称;

(2)自由度越小,峰部越矮,而尾翘得越高;

(3)当自由度增大时,t分布逼近u分布(标准正态分布),当自由度无穷大时,t分布就是标准正态分布;

(4)t分布是一簇曲线,自由度不同,曲线的形状不同

参考 <https://www.360kuai.com/pc/999af5d60c3b37c14?cota=4&kuai_so=1&tj_url=so_rec&sign=360_57c3bbd1&refer_scene=so_1>

T-test

用于小样本的两个平均值差异程度的检验方法,是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。

T统计量(T-statistic)和T检验(T-test)

t-test是指用T-statistic来做假设检验(hypothesis testing),而T-statistic是根据model计算的,用来做检验的统计量.

正常T-statistic应该在0假设(null hypothesis)为真时,服从T分布(T-distribution).

T-test时根据T-statistic值的大小计算p-value,决定是接受还是拒绝假设.

参考:http://blog.sina.com.cn/s/blog_6cb445270102ymkq.html

One Sample T-test

在知道样本均值时验证平均差的时候使用。

具体体现为:比较平均值与特定数字相同/大/小时使用

Paired T-test

对应的两个(同样/类似)集合差异比较。

对立假设:

  • 减肥前后的体重变化不是0
  • 使用心得学习方法后成绩差异不是0
  • 同一时间段内A代理店与竞争B代理店的卖出额差异不是0

例如 两个集团,各8个a资料,自由度是8-1=7

Two Sample T-test

比较两个相互不同的独立group间的平均差异。

对立假设:

  • 男性平均体温与女性平均体温有差异
  • A品牌轮胎与B品牌轮胎寿命有差异

t=group间平均差异/group内变动

group间平均差异比gourp内变动明显很大的话,验证统计量就会更大,P值变小,就能驳回H0假设。

Two Sample t-test 从下面三个基本假设出发:

1.独立性(Independency) ←各观测值不会互相影响,比如男子group和女子group互相独立

2.正态性(Normality) ← 根据独立变数的从属变数满足正态分布的正态性,只要样本量增加就能自然的解决

3.等分散性(Equal Variance) ←根据独立变数的从属变数分布的分散在各group相同( 因等分散与否,分析方法不一样)

分散:反应在统计里变量的平均的距离;分散相同的情况叫等分散,这种情况使用学生t分布;分散不同的情况叫E分散,使用E验证。

学生t表格

学生t表格,行为d.f.(自由度),列为1-α

(个人理解:服从t分布的对应自由度和概率下的t临界值)

例如:n=5,自由度为4,第5列值为2.132,对应的单侧值是95%,双侧值5%,

表示T<2.132的概率是95%(单侧),

记为Pr(−∞ < T < 2.132) = 0.95;T介于-2.132和2.132之间的概率为90%(双侧),记为

Pr(−2.132 < T < 2.132) = 0.9

参考 <https://baike.baidu.com/item/t%E5%88%86%E5%B8%83/299142?fr=aladdin#3>

ANOVA

Analysis of Variance 方差分析/分散分析:同时判断多个正态总体均值是否相等的统计方法。

F分布假设验证的方法。

例如:可以比较三个集团以上的平均,性别、年龄段SNS使用时间的两个以上变量的比较

  • 独立变量只有一个----一元分散分析
  • 独立变量有两个以上-----二元分散分析

ANOVA有下面三个基本假设:

  1. 独立性(Independency)
  2. 正态性(Normality)
  3. 等分散性(Equal Variance) (方差相同)

等分散性验证方法(Bartlett’s test)。

方差:(各个值-平均值)的平方和/样本个数

零假设和对立假设

零假设: 所有集合的平均一样,

对立假设:集合中至少有一个以上的平均不一样.

事后校验

采纳对立假设的情况下,接着有些group的平均相同与否要进行多重比较,这个叫事后验证。

事后校验:两两校验,有名的方法是Duncan, Tukey, Scheffe。

Ex: { G1, G2, G3, G4 } 4个集合事后校验=> 组合数: 4个里面选两个nC2=6

Tukey是把group组成对即pairwise检查。

SSA:如果各group的样本平均值相同时没有差异,SSA会为0.

SST=SSE+SSA

MSA=SSA/(k-1) 平均平方

MSE:误差平方

残差error : 所以是SSE

SST中T表示total

MSE=SSE/(n-k)

F=MSA/MSE ~F(k-1,n-k)

分散分析表/方差分析表

方差来源

平方和

自由度

均方

F值

因素A

SSA

s-1

MSA=SSA/(s-1)

F=MSA/MSE

误差

SSE

n-s

MSE=SSE/(n-1)

总和

SST

n-1

离差平方和与其自由度的壁纸,称为该离差平方和的均方,记为MS.

组内均方(组内方差):MSE=SSE/(n-s)

组间均方(组间方差):MSA=SSA/(s-1)

T检验 ANOVA相关推荐

  1. 【定量分析、量化金融与统计学】R语言方差分析ANOVA(F检验)

    目录 一.前言 Fixed-effects models.Random-effects models.Mixed-effects models. 二.ANOVA使用的前提假设与假设检验 三.ANOVA ...

  2. SPSS数据分析中出现的常见问题总结

    总结最近数据分析过程中遇到的一些问题的思考 1.问卷中多选题的录入与分析 2.数据分析流程的第一步:对所分析的样本数据本身的特征结构进行预分析 3.根据数据中的某个因素的几个水平来分析数据总体的差异性 ...

  3. 使用MicrobiomeAnalyst统计和功能分析微生物组数据

    文章目录 使用MicrobiomeAnalyst进行微生物组数据的全面统计.功能和元分析 摘要 背景Introduction 分析流程和界面设计 图1 MicrobiomeAnalyst工作流程概述. ...

  4. NatureProtocols:使用MicrobiomeAnalyst统计和功能分析微生物组数据

    文章目录 使用MicrobiomeAnalyst进行微生物组数据的全面统计.功能和元分析 摘要 背景Introduction 分析流程和界面设计 图1 MicrobiomeAnalyst工作流程概述. ...

  5. Nature子刊:教你零基础开展微生物组数据分析和可视化

    使用MicrobiomeAnalyst进行微生物组数据的全面统计.功能和元分析 Using MicrobiomeAnalyst for comprehensive statistical, funct ...

  6. rda分析怎么做_数量生态学笔记||冗余分析(RDA)

    上一节数量生态学笔记||冗余分析(RDA)概述中,我们回顾了RDA的计算过程,不管这个过程我们有没有理解透彻,我希望你能知道的是:RDA是响应变量矩阵与解释变量之间多元多重线性回归的拟合值矩阵的PCA ...

  7. 【转载】SPSS数据分析中出现的常见问题总结

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/m0_37752335/article/details/77526766 总结最近数据分析过程中遇到的 ...

  8. rda冗余分析步骤_数量生态学笔记||冗余分析(RDA)

    上一节数量生态学笔记||冗余分析(RDA)概述中,我们回顾了RDA的计算过程,不管这个过程我们有没有理解透彻,我希望你能知道的是:RDA是响应变量矩阵与解释变量之间多元多重线性回归的拟合值矩阵的PCA ...

  9. R语言 CHAR 09

    一元线性回归 确定因变量与自变量的关系 建立线性关系模型,并对模型进行估计和检验 利用回归方程进行预测 对回归模型进行诊断 绘制散点图 library(car) scatterplot(销售收入~广告 ...

最新文章

  1. python * 与 ** 分别代表元组和字典
  2. 手把手教你写一个生成对抗网络
  3. sqlite3里类似top的用法
  4. meta常用标签总结
  5. python下载word文件-python-docx操作word文件(*.docx)
  6. spring框架中JDK和CGLIB动态代理区别
  7. c++调用python的代码、函数、类
  8. Thinking in java第一章对象导论
  9. 2020年高考数学试题难吗?历史上最难数学卷不是2003!
  10. 【RabbitMQ】 WorkQueues
  11. C++ 实现一个简单内存池
  12. 原来编译通过,现在编译不通过,怎么回事?
  13. python 颜色大全 颜色对应 matplotlab plot 颜色对应
  14. jQuery blockUI 使用详解
  15. 完美解决office07或2010安装错误1706
  16. Android下磁盘分区表损坏,硬盘分区表修复,教您硬盘分区表损坏怎么修复
  17. oracle停止 sparc,我现在可以清楚地看到云已经消失了:Oracle 12c on-premises for Linux,SPARC...
  18. 图表xAxis文字竖排显示
  19. 蓝桥杯java B组历年省赛真题汇总及题目详解
  20. JAVA Spring

热门文章

  1. 如何用地推进行有效获客降低成本提高效率?
  2. java 短信找回密码_Java --修改密码/找回密码 接口共用
  3. 《深度学习推荐系统》
  4. 利用Python3实现:非常“实用”的身高计算器(源代码)
  5. 国内下载安装Chrome插件
  6. 时间序列常见模型介绍与实战(SPSS)
  7. Hive经典最全笔试题系列
  8. 守望先锋:地图工坊FOR,IF,WHILE分享
  9. 鸢尾花决策树分类及可视化
  10. Failed to read schema document 'http://code.alibabatech.com/schema/dubbo/dubbo.xsd'问题解决方法