统计学(statistics):****收集、处理、分析、解释数据并从数据中得出结论的科学。
描述统计(descriptive statistics):研究数据收集、处理和描述的统计学方法。
推断统计(inferential statistics):研究如何利用样本数据来推断总体特征的统计学方法。







中心极限法则:一个随机变量,不管是什么分布,当其样本足够大时,其均值不是原来的分布,而是自然分布。
所以并不是原来的变量的分布改变了,其实并没有变,只是他的均值满足自然分布而已。



《九成以上研究者或无法正确理解p值》






回归定义:
回归,指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。

在统计学中,线性回归方程是利用最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。
像所有形式的回归分析一样,线性回归也把焦点放在给定X值的y的条件概率分布,而不是X和y的联合概率分布(多元分析领域)。

1. 相关系数的概念
著名统计学家卡尔·皮尔逊设计了统计指标——相关系数(Correlation coefficient)。
相关系数是用以反映变量之间相关关系密切程度的统计指标。
相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;
着重研究线性的单相关系数。

【文字稿】

线性回归分析的步骤如下:
(1)根据预测目标,确定自变量和因变量
围绕业务问题,明晰预测目标,从经验、常识、以往历史数据研究等角度,初步确定自变量和因变量。
(2)绘制散点图,确定回归模型类型
通过绘制散点图的方式,从图形化的角度初步判断自变量和因变量之间是否具有线性相关关系,同时进行相关分析,根据相关系数判断自变量与因变量之间的相关程度和方向,从而确定回归模型的类型。
(3)估计模型参数,建立回归模型
采用最小二乘法进行模型参数的估计,建立回归模型。
(4)对回归模型进行检验
回归模型可能不是一次即可达到预期的,通过对整个模型及各个参数的统计显著性检验,逐步优化和最终确立回归模型。
(5)利用回归模型进行预测
模型通过检验后,应用到新的数据中,进行因变量目标值的预测。

文字版:

新手必看!统计学知识大梳理

你的“对象” 是谁?
o“对象”按照维度分为了两大类:统计学,概率论。
一维:就是当前摆在我们面前的“一组”,“一批”,哪怕是“一坨”数据。这里我们会用到统计学的知识去研究这类对象。
二维:就是研究某个“事件”,笔者认为事件是依托于“时间轴”存在的,过去是否发生,现在是可能会出现几种情况,每种情况未来发生的可能性有多大?这类问题是属于概率论的范畴。
分析就像在给 “爱人” 画肖像
o“集中趋势—代表值”,“分散和程度”
对“数据”的描述性分析
o1.集中趋势量度:
为这批数据找到它们的“代表”

均值(μ)

均值的局限性
o“若用均值描述的数据中存在异常值的情况,会产生偏差”
中位数

中位数,又称中点数,中值。
o是按顺序排列的一组数据中居于中间位置的数。
众数
众数是样本观测值在频数分布表中频数最多的那一组的组中值。
o2.分散性与变异性的量度
全距=max-min
全距的局限性
o若数据中存在异常值的情况,会产生偏差
差
方差
标准差
标准分——表征了距离均值的标准差的个数
关于“事件”的研究分析
o1.一个事件的情况
事件:
有概率可言的一件事情,一个事情可能会发生很多结果,结果和结果之间要完全穷尽,相互独立。
概率:
每一种结果发生的可能性。所有结果的可能性相加等于1,也就是必然!!!
概率分布:
我们把事件和事件所对应的概率组织起来,就是这个事件的概率分布。
期望:
表征了综合考虑事情的各种结果和结果对应的概率后这个事情的综合影响值。
(一个事件的期望,就是代表这个事件的“代表值”,类似于统计里面的均值)
方差:
表征了事件不同结果之间的差异或分散程度。
o2.细说分布
“离散型”数据和“连续性”数据差异
离散型分布
这三类离散型的分布,在“0-1事件”中可以采用,就是一个事只有成功和失败两种状态。
连续型分布
连续型分布本质上就是求连续的一个数据段概率分布。
正态分布
of(x)----是该关于事件X的概率密度函数
o
μ — 均值
o
σ^2 —方差
o
σ —标准差
o
绿色区域的面积 —该区间段的概率
o正态分布概率的求法
step1 — 确定分布和范围 ,求出均值和方差

step2 — 利用标准分将正态分布转化为标准正态分布 (还记得 第一部分的标准分吗?)

step3 —查表找概率
o离散型分布 → 正态分布 (离散分布转化为正态分布)
o3.多个事件的情况:“概率树”和“贝叶斯定理”
多个事件就要探讨事件和事件之间的关系
对立事件:
o如果一个事件,A’包含所有A不包含的可能性,那么我们称A’和A是互为对立事件

穷尽事件:
o如何A和B为穷尽事件,那么A和B的并集为1

互斥事件:
o如何A和B为互斥事件,那么A和B没有任何交集

独立事件:
o如果A件事的结果不会影响B事件结果的概率分布那么A和B互为独立事件。
条件概率(条件概率,概率树,贝叶斯公式)
已知B事件发生的条件下,A事件发生的概率

概率树
o— 一种描述条件概率的图形工具。

贝叶斯公式 ----提供了一种计算逆条件概率的方法
o当我们知道A发生的前提下B发生的概率,我们可以用贝叶斯公式来推算出B发生条件下A发生的概率。
关于“小样本”预测“大总体”

o1.抽取样本

总体:
你研究的所有事件的集合;

样本:
总体中选取相对较小的集合,用于做出关于总体本身的结论;

偏倚:
样本不能代表目标总体,说明该样本存在偏倚;

简单随机抽样:
随机抽取单位形成样本。

分成抽样:
总体分成几组或者几层,对每一层执行简单随机抽样

系统抽样:
选取一个参数K,每到第K个抽样单位,抽样一次。
o2.预测总体(点估计预测,区间估计预测)
如何求置信区间?
图例
(t分布)
我们之前的区间预测有个前提,就是利用了中心极限定理,当样本量足够大的时候(通常大于30),均值抽样分布近似于正态分布。若样本量不够大呢?这是同样的思路,只是样本均值分布将近似于另一种分布处理更加准确,那就是t分布。
(卡方分布)
卡方分布的定义
o若n个相互独立的随机变量ξ、ξ、……、ξn ,均服从标准正态分布,则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布。
卡方分布的应用场景
o
用途1:用于检验拟合优度。
也就是检验一组给定的数据与指定分布的吻合程度;
o
用途2:检验两个变量的独立性。
通过卡方分布可以检查变量之间是否存在某种关联:
o3.验证结果(假设检验)
假设检验是一种方法用于验证结果是否真实可靠。具体操作分为六个步骤。
两类错误
第一类错误:
o拒绝了一个正确的假设,错杀了一个好人

第二类错误:
o接收了一个错误的假设,放过了一个坏人
即使我们进行了“假设检验”依然无法保证决策是百分百正确的,会出现两类错误

相关与回归(y=ax+b)
o线性回归
散点图:
显示出二变量数据的模式。

相关性:
变量之间的数学关系。

线性相关性:
两个变量之间呈现的直线相关关系。

最佳拟合直线:
与数据点拟合程度最高的线。
(即每个因变量的值与实际值的误差平方和最小)

误差平方和SSE:
o
线性回归法:
求最佳拟合直线的方法(y=ax+b),就是求参数a和b

斜率a公式:
b公式:

期望:

这三类离散型的分布,在“0-1事件”中可以采用,就是一个事只有成功和失败两种状态。

当我们知道A发生的前提下B发生的概率,我们可以用贝叶斯公式来推算出B发生条件下A发生的概率。

关于“小样本”预测“大总体”

正态分布

“对象”按照维度分为了两大类:统计学,概率论。

(卡方分布)

标准差

斜率a公式:

标准分——表征了距离均值的标准差的个数

概率分布:

b公式:

图例

条件概率(条件概率,概率树,贝叶斯公式)

我们之前的区间预测有个前提,就是利用了中心极限定理,当样本量足够大的时候(通常大于30),均值抽样分布近似于正态分布。若样本量不够大呢?这是同样的思路,只是样本均值分布将近似于另一种分布处理更加准确,那就是t分布。

— 一种描述条件概率的图形工具。

假设检验是一种方法用于验证结果是否真实可靠。具体操作分为六个步骤。

“集中趋势—代表值”,“分散和程度”

均值(μ)

对“数据”的描述性分析

两类错误

方差

关于“事件”的研究分析

参考文献:

  1. 新手必看!统计学知识大梳理(附框架图&公式)
  2. https://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247499582&idx=1&sn=e9b250dd438e0433386e71db14d3d74f&chksm=e9e1f6b5de967fa30982c10b028d4b7d8d84e549c24a0ae8020c1314a3a2bf4889756aaf8b14&mpshare=1&scene=1&srcid=&sharer_sharetime=1582706620792&sharer_shareid=a12c15ddef863cf656d340c52b1b88f5#rd

【思维导图】统计学知识大梳理相关推荐

  1. python编程思维导图_用来梳理 Python 编程核心知识15张思维导图

    原标题:用来梳理 Python 编程核心知识15张思维导图 小编这次在逛论坛的时候,无意中发现了一份python的武功秘籍,也就是一份思维导图,堪称业界经典! 思维导图可以有力地激发你的联想,通过一个 ...

  2. 个人知识体系思维导图_“知识体系”打得好,学霸孩子跑不了,巧用“思维导图”来帮忙...

    文章纯属原创,版权归本作者所有,欢迎个人转发分享. 相信很多妈妈都会看见孩子学习学不进去的苦恼,孩子看着很用功,每天按时完成作业.做练习题,但是成绩就是一直上不去,还会出现成绩不升反降的情况.这成了许 ...

  3. 【数据结构】思维导图补充知识

    思维导图链接 例题总结链接 排序算法思想和动图 排序算法代码 DS重点 1.⭐⭐必背概念定义: 2.⭐⭐必考解答题: 2.1 绪论: 2.2 线性表: 2.3 栈 2.4 队列 2.5 树和二叉树(必 ...

  4. 通过思维导图学习知识的两种模板鉴赏

    在学习中,我们可以制作思维导图来帮助记忆.理解.正所谓千言万语不如图,一张简单的思维导图就能涵盖整篇文章的中心思想.分析出事物之间的关系.而在制作思维导图的时候,人脑也跟着进行分析,这才是思维导图最大 ...

  5. 【转】ADO.Net之SqlConnection、 Sqlcommand的应用学习心得(思维导图,知识解析,案例分析)

    ADO.Net之SqlConnection. Sqlcommand的应用 一.思维导图: ADO.NET与SQL连接: 二.知识点介绍: SqlConnection和Sqlcommand都是组成数据提 ...

  6. 思维导图-------java-IO流知识结构梳理

    基类文件流 的使用 开始   2018年8月10日16:37:41 结束   2018年8月10日18:24:19 package 面向对象;import java.io.FileInputStrea ...

  7. 5张思维导图,jQuery知识点梳理

    好记性不如烂笔头,有人帮你,是你的幸运,没人帮你,才是正常的生活. 整理了以前的jquery思维导图,个别添加了小案例,有需要的小伙伴自行下载查看哦~ 一.关于选择器 二.关于DOM操作 三.关于事件 ...

  8. [数据分析自学帮手]数据分析必备的统计学知识大梳理,还不赶紧收藏?

    目录 写在前面的话 今天的主题是数据分析要用到的统计学知识 如何学到统计学知识? 概率与概率分布 样本空间 随机事件 概率 概率分布 用图表演示数据 1.数据类型 2.统计表 3.统计图 数据的概括性 ...

  9. 统计学知识大梳理(三)

    统计量及其抽样分布 抽样容易理解,抽样分布不容易理解. 抽样是从整个研究中抽取一部分个体作为我们真正的研究对象.我们可以简单地把样本理解为整体的一个子集,并通过样本的结果来推断整体情况.例如,我们想知 ...

最新文章

  1. win7系统下配置openCV python环境附加 numpy +scipy安装
  2. 再谈编程范式-程序语言背后的思想
  3. 【Opencv实战】这个印章“神器”够牛,节省了时间提高了效率,厉害~(附完整源码)
  4. 理解变量字符的截取功能
  5. 【MyBatis】MyBatis中,大于号、小于号的两种表达方式
  6. linux下更换pip源
  7. java poi excel 单元格样式_java poi批量导出excel 设置单元格样式
  8. 低功耗/远距离lora模块:物联网智能家居、抄表多领域应用SX1262芯片方案
  9. Think in AngularJS:对比jQuery和AngularJS的不同思维模式
  10. dao层和service层和control_最受欢迎Java数据库访问框架(DAO层)
  11. 力扣-1232 缀点成线
  12. 通过shell进行数学计算
  13. 强化学习 马尔可夫决策过程(MDP)是什么
  14. IIS6上传文件尺寸太小解决办法
  15. swiper禁用手动拖拽
  16. 全球卫星导航系统(GNSS)相关概念总结
  17. 情侣博客,我也想做一个。
  18. 龙芯2K1000开发板资料1.2版更新了
  19. push()与pop()的使用
  20. 终于可以写shui题了~

热门文章

  1. php+thinkphp的家乡石泉网站-乡村家乡旅游信息网站
  2. java入职学习一之编码规范
  3. 【电子学会】2020年12月图形化四级 -- 绘制雪花
  4. Windows10专业版(1709_1803_1809)_64位2018.10(纯净版)
  5. php扫码获取财付通cookie,基于OpenCart 开发支付宝,财付通,微信支付参数错误问题...
  6. vue中后台管理中使用水印
  7. php sqlserver 数组,mssql_fetch_array
  8. dnfex服务器维护,DNF Ex更新失败怎么办 最全解决方法介绍
  9. 苹果怎么找计算机历史记录,苹果备忘录怎么查看历史更改记录?有可以查看历史记录的便签软件吗...
  10. python 函数定义的样例