推断性统计学(一,二)
推断性统计学(一,二)
我之前在上概率论与数理统计这门课的时候,关于推断性统计有很多知识都没有仔细地去看,因此过了一年就忘记了。因此在我马上学习深度学习之际,想对它重新复习一下。所以在Udacity上我选了这门课。
,这一系列的博客就是按照Udacity的《推断性统计学》来写的。
首先Udacity上的这门推断性统计是接着描述性统计课来的。所以它的第一章是在总结描述性统计的内容。但是笔者根本没有看见这段话!因此在一开始学习的时候是懵逼的——为什么直接从第7章开始了?为什么一开始上来就这么多问题?在学了一段时间后,才渐渐从懵逼中缓和。
知识点
点估计与区间估计
点估计(point estimation)是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。
区间估计(interval estimation)是参数估计的一种形式。通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。
以上解释来源于百度百科。
- 点估计的最常见的应用就是矩估计,例如利用抽样均值来估计总体均值。
- 区间估计的最常见应用则是置信区间,这在假设检验中经常使用。
接下来我们要说的Z假设检验就利用了区间估计。
标准误差
标准误差(Standard Error) δs \delta_s是对误差的一种估计,其公式为:
\delta_s= \sqrt {\delta \over n}\quad\delta为样本方差,n为样本个数。
标准误差的意义在于反应了利用 x⎯⎯ \overline x估计 μ \mu的偏差程度,从数学上也很容易得到其意义的推导,只需要将 x⎯⎯ \overline x视为随机变量,带入方差公式即可。
Z score
Z score就是常说的Z检验统计量,它的公式为:
z={\overline x-\mu \over \delta_s}\quad其中\mu为总体均值,\delta_s为标准方差,n为样本个数。
Z socre服从标准正态分布,因此 p(|z|<ξ) p(|z|的概率可以很容易借助查表的方式得到,方便检验。
Z检验
Z score Z\ score检验(Z Test)一般用于大样本的均值差异性检验,利用 Z score Z\ score服从标准正态分布这一特性来推断样本的均值与某分布总体是否存在显著差异。
步骤:
- 建立原假设:样本均值 x⎯⎯ \overline x与总体均值 μ \mu无显著差异。
- 计算 Z score Z\ score及其置信区间。
- 根据 Z score Z\ score是否落在置信区间内来判断原假设是否成立,若 Z score Z\ score在置信区间内则接受原假设,否则拒绝原假设。
其中置信区间的选择要根据具体问题合理构建,常用的有两个置信区间:
- (-1.96,1.96),置信度为0.95
- (-2.33,2.33),置信度为0.98
小练习
计算标准误差
已知总体均值为1.4432,总体方差为1.2322,请问从该总体中随机抽取规模为16的样本,其均值的期望是多少?标准误差为多少?
计算Z检验
接着上问已知现有一样本,规模为16,均值为1.7384。请问该样本是否服从上问的总体分布?
参考资料
http://baike.baidu.com/item/%E7%82%B9%E4%BC%B0%E8%AE%A1
http://baike.baidu.com/item/%E5%8C%BA%E9%97%B4%E4%BC%B0%E8%AE%A1
http://wiki.mbalib.com/wiki/Z%E6%A3%80%E9%AA%8C
https://cn.udacity.com/course/intro-to-inferential-statistics–ud201
推断性统计学(一,二)相关推荐
- #统计学相关,Z分布,推断性统计
#统计学相关,Z分布,推断性统计 #推断性统计一般分三步走,1抽样,2对样本进行预测,3对结果进行评估(假设性检验) #在预测方面(即上第二步),有以下几种情况,点估计(就好比在一条线中,抽出线上的点 ...
- 空间统计分析_CDA 数据分析师 Level 1 备考系列之推断性统计分析概述
推断性统计相关概念与图表 随机试验.随机事件.随机变量 随机试验:a.可以在相同的条件下重复的进行:b.每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果:c.进行一次试验之前不能确定哪一个 ...
- Retbleed:针对英特尔和AMD处理器的推断性执行攻击
聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 苏黎世联邦理工学院的研究人员表示,新型推断性执行攻击可导致英特尔和AMD处理器信息泄露.这种攻击被命名为 "Retbleed" ...
- 推断性统计部分(三)---假设检验
推断性统计部分(三)-假设检验 标签(空格分隔): 概率论与数理统计 假设检验 假设检验与置信区间其实是一样意思,区别就是再多做两步工作(假设及判断),仅此而已. 我们先回顾置信区间是计算的 1.判断 ...
- 【正项级数】敛散性判别(二)
[正项级数]敛散性判别(二) 比值判别法和根植判别法 比值判别法和根植判别法 例题 比值/根植判别法失效时,该怎么处理? 例题 比值判别法和根植判别法 比值判别法和根植判别法 例题 例1 一般遇到阶乘 ...
- 数据分析必备的统计学(二):假设检验
此文是<10周入门数据分析>系列第10篇 想了解学习路线,可以先阅读" 学习计划 | 10周入门数据分析 " 讲完概率分布,再来讲讲统计学的最后一个知识点--假设检验. ...
- 大数据之统计学基础(二):随机变量及其概率分布
随机变量及其概率分布 随机变量(r.v)是研究随机试验中的一串事件:比如掷一颗骰子,用X表示骰子的点数,由于X的取值我们无法确定,所以称X是一个随机变量,随机变量的取值随机会而定. 1.随机变量的类型 ...
- C/C++左值性精髓(二)哪些表达式是左值,哪些是右值?----右值表达式
2019独角兽企业重金招聘Python工程师标准>>> C对于右值的定义是表达式的值,C中所有完整表达式的结果都是右值.所谓完整表达式(full expression),指的是这样的 ...
- 统计学(二)之一般线性模型(一)
一般线性模型 统计博大精深,学习永无止境(被搞死) GLM(General Linear Model) 一.一般线性模型的组成 方差分析(ANOVA) 成组设计的方差分析 配伍设计的方差分析 多因素方 ...
最新文章
- Java内存模型深度剖析
- find查找文件的时候排除某个或几个文件或目录
- javascript权威指南学习笔记
- 一个故事讲清楚 NIO
- 【XAudio2】5.如何初始化 XAudio2
- java 正确使用 Volatile 变量
- JAVA中的设计模式三(策略模式)
- makefile obj文件路径_Makefile一问:如何修改.o输出文件的输出路径 Linux/Unix社区 / 程序开......
- 使用SoapUI调用安全WCF SOAP服务–第1部分,该服务
- 【渝粤题库】广东开放大学 基础写作 形成性考核
- 前端学习(1620):前端系列实战课程之提取行间样式
- linux系统C语言学习总结
- scrapy抓取淘宝女郎
- java mvc tomcat_Java Servlet(七):JavaWeb MVC 操作(jdk7+tomcat7+eclipse)
- sql怎么读_mysql由于快照读,造成数据混乱,该如何解决
- Tomcat服务器搭建及测试教程,腾讯+华为+阿里面试真题分享
- 程序员修炼之道 pdf_程序员修炼之道-注重实效
- 由浅入深,汇编语言详解与二进制漏洞初阶
- VAssistX的卸载方法
- svn版本库浏览器_版本库浏览器
热门文章
- matlab的2维矩阵和3维矩阵维度变换,二维矩阵变换三维矩阵,2D矩阵转换3D矩阵
- Google 游戏开发者峰会盘点|视频合集来了!
- 什么样的护眼灯适合学生用?学生专业读写护眼灯
- 社区小程序源码-带后台
- UI设计开发移动客户端流程经验
- 上海电力学院计算机辅助设计2,上海电力学院电路计算机辅助设计2--正弦激励下的RL一阶电路的响应...
- 感知器算法原理详解及python实现
- git查看打tag时间_git打tag
- 2016河北省职称计算机考试试题,2016年最新河北省职称计算机考试试题及答案(参考).doc...
- android 如何使用httpurlconnection下载一张图片demo