统计检验:参数估计、卡方检验、T检验、方差分析、相关分析
样本t检验、方差分析、相关分析都可以用来筛选变量。

参数估计的两种方式:点估计和参数估计,用样本来推断总体。
问题:领导让你统计一下北京9月平均房价是多少??
点估计:
事实是这样的,你不可能是统计到所有房屋的价格,所以一般会采取随机抽样的方式,抽取一些个样本,然后用样本的均值来估计总体均值,ok,这个时候大家可能会有个疑问,毕竟是随机抽样,用样本均值直接来估计总体是不是有可能不准啊,很容易受到抽样的样本影响,是的,那我们把给定一个均值区间是不是会好点,这个时候就有了区间估计,这样也有一个好处,方便大家甩锅,哈哈。举个例子你用区间估计得出北京9月平均房价有95%的概率落在(6万,9万)区间内,那么小于6万和大于9万的概率是2.5%,如果实际是10万,追责起来实力甩锅,虽然是小概率,不代表不会发生,是不,哈哈。
区间估计:
我们引入均值正态分布从而将问题描述成北京9月平均房价有多大的概率落在这个置信区间(均值的标准误)内,这就是区间估计(请注意这里是均值的标准误,每次抽取一组样本,都会产生一个均值,这些均值重新组合成一个集合,这个集合的标准差就是均值的标准误,因为计算它需要抽取很多组的数据,所以使用下面的公式来计算)。

区间估计实际上是假设样本均值满足正态分布,样本均值满足正态分布的理论基础就是中心极限定理,只要样本抽的足够多(N>30以上),样本均值将有很大可能会服从正态分布,如果样本均值满足正态分布就可以用置信区间和置信水平来进行度量)。

样本均值满足正态分布:如果样本是正态分布,那么样本均值就是正态分布;如果样本不是正态分布,那么根据中心极限定理,继续抽更多的样本之后(N>30),样本均值就会满足正态分布。

也可以参考知乎回答:https://www.zhihu.com/question/21871331

正态分布检验方法:
连续变量用概率密度函数,或者是QQ图

卡方检验
检验分类变量之间是否存在差异,对于小样本量(小于10000)而言,根据p值来看显著性。

T检验
假设前提:样本是正态或接近正态分布,对于多组变量而言,还需要进行方差齐性levene检验,方差齐不齐最后检验的方法是不一致的。

T检验包括3种:单样本T检验、独立样本T检验(比如男女性别之间的语文成绩是否存在差异),配对样本T检验(比如患者在使用某药物前后某指标的变化是否存在显著性差异)。

还是上面那个例子,领导说北京9月平均房价会大于10%吗???或者说大于10%的概率是多大???这个时候可以用到单样本T检验,随机抽取一些样本,看样本均值与10%差距有多大。

原假设H0:u = 0.1
备择假设H1:u ≠ 0.1

这里有一个小概率事件的理论,意思就是本来不该在一次试验中发生的小概率事件却发生了,就拒绝原假设,从而接受备择假设。
在这里我们需要用到下面这张图,其中白色部分是接受域,蓝色部分是拒绝域,如果0.1落在了白色区域(实际上就是给定一个置信区间)内,我们就接受原假设,反之拒绝原假设,接受备择假设。
在实际做的时候,直接用spss或者python得出样本均值与给定均值的P值,如果 P < α,拒绝原假设;反之接受原假设。

显著度水平α怎么取:
样本小于100,10%
样本100-500 , 5%
样本500-1000, 1%
样本2000左右, 0.1%

什么情况下P会失效?
如果样本量上万,这个是没有太大意义的,为什么这么说呢,因为随着样本数量的不断增加,就越有可能发生小概率事件,从而越容易拒绝原假设,接受备择假设,所以如果样本量很大的情况下要用这些统计检验,那就对数据多进行几次抽样,然后看P值。

方差分析:
假设前提:各样本相互独立,且方差齐。
一个连续变量,一个分类变量(3种类别以上),实际上也能用两样本T检验,两两组合进行检验,不过比较麻烦。假设各组均值全部相等。

相关分析:
两个连续变量之间的关系,先看散点图。
pearson相关系数:描述线性变量之间的关系
Sperman相关系数:描述指数关系,没有拐点
kendall相关系数:描述拐点的变量之间的相关性,如抛物线

相关分析和回归分析的区别:
相关分析是检验变量之间相关性有多强,变量之间是对等的的;回归分析是将变量之间的关系用形如y=f(x)的关系表达出来,需要划分解释变量和被解释变量,在线性回归中,β0是无法解释的,比如我们要探讨身高x和体重y之间的关系,建立了一个回归方程:y = β0 + β1 * x,但在实际中x=0根本就不可能发生,而且我们在解释的时候也是这样的,身高没增加1cm,体重增加多少。

统计推断中的参数估计和假设检验相关推荐

  1. 参数估计与假设检验的通俗理解

    文章目录 参数估计 假设检验 参数估计 For 高手: 参数估计(parameter estimation),统计推断的一种.根据从总体中抽取的随机样本来估计总体分布中未知参数的过程.从估计形式看,区 ...

  2. matlab假设检验摘要,MATLAB数据统计和分析:参数估计和假设检验

    参数估计和假设检验 统计所研究的对象是受随机因素影响的数据,是以概率论为基础的一门应用学科.统计推断的基础是描述性统计,也就是搜集整理加工分析统计数据,使其系统化和条理化,以显示出数据资料的趋势.特征 ...

  3. 数理统计之参数估计与假设检验(二)——经验分布函数与QQ图

    参数估计与假设检验 经验分布函数 定义 具体应用 Q-Q图 例题 参考文献 经验分布函数 定义 设 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1​,X2​,.. ...

  4. 描述性统计、参数估计和假设检验

    描述性统计分析 描述性统计所提取的统计的信息称为统计量,包括频数与频率,反映集中趋势的均值.中位数.众数和分位数,反映离散程度的极差.方差和标准差,反映分布形状(相对于正态分布)的偏度和峰度. 变量分 ...

  5. 状态空间模型中实际参数估计

    状态空间模型中实际参数估计 状态扩增法 线性状态空间模型的参数估计 利用高斯滤波与平滑的参数估计(非线性模型) 基于粒子滤波与平滑的参数估计 参数的 Rao-Blackwell 化 (参数估计所有内容 ...

  6. 利用nls进行非线性模型中的参数估计

    nls参数估计 利用nls进行非线性模型中的参数估计 R中的nls用于非线性回归建模,对非线性函数的参数进行最优化的过程,最优化后的参数会使得模型的RSS(残差平方和)达到最小. 1.非线性函数 本例 ...

  7. 5 MATLAB参数估计与假设检验-参数估计

    第5--9章结构框架 参数估计: 更多MATLAB数据分析视频请点击,或者在网易云课堂上搜索<MATLAB数据分析与统计> http://study.163.com/course/cour ...

  8. 从线性模型到广义线性模型(2)——参数估计、假设检验

    本文系转载,原文链接:http://cos.name/2011/01/how-does-glm-generalize-lm-fit-and-test/ 1.GLM参数估计--极大似然法 为了理论上简化 ...

  9. 推断统计python化(参数估计,假设检验与 t检验)

    目录 1.参数估计 1.1 点估计 1.2 区间估计 1.2.1 区间估计概述 1.2.2 区间估计的方法 1.3 进行区间估计的Python函数 2. 案例分析 3. 假设检验 3.1 假设检验概述 ...

最新文章

  1. Javascript函数执行、new机制以及继承
  2. boot项目中pom依赖已经删除了但是maven上还是报红线_Java Web项目是怎么跑起来的?...
  3. 全球及中国服务器电源行业市场深度策略分析及投资规划咨询建议报告2022-2028年版
  4. 漫画:什么是狭义相对论?
  5. Duilib编辑框Edit输入完自动跳到下一个编辑框
  6. vue value key
  7. redis的java客户端名称_java里常用的redis客户端简介
  8. 华为技术有限公司申请“荣耀视频”、“荣耀钱包”等商标
  9. mysql性能测试工具之sysbench
  10. 02. Compose 可组合组件之 属性 modifier
  11. 实战分享:GNSS知识汇总
  12. 网络三维虚拟展馆开发优势
  13. 1051 复数乘法(JAVA)
  14. JESD204接口调试总结——Xilinx JESD204B IP testbench解析
  15. DevExpress CMB下拉树
  16. Hexo博客框架的搭建与使用
  17. uniapp 电子印章_Uni-app 之文章案例
  18. Android程序开发意见反馈的实现
  19. (javascript)常用农历(12生肖年,天干地支,节气)
  20. 中兴ZXR10 160智能集成多业务路由器快速安装指南,图文并茂

热门文章

  1. 江民杀毒 90天试用序列号申请
  2. matlab求马尔可夫转移矩阵,求马尔科夫模型的转移矩阵_马尔科夫转移矩阵
  3. php自适应浏览器,css如何自适应浏览器
  4. 12(PHP图像的制作,例如验证码)
  5. vscode内c++调用python内函数
  6. [故事]女博士在京辛酸买房记:同学想读博吗?先买个房吧
  7. 可上网Linux,可以上网了
  8. Google App Engine+GAppProxy 架设个人代理服务器
  9. redis中的incr命令和incrby命令
  10. matlab 控制图例个数,MATLAB 识别图像中米粒个数