这篇文章主要介绍了什么是统计学,以及构成统计学的基本框架,是统计学这门学科的基本面貌。

01

什么是统计学?

《行为科学统计精要》一书对统计学的定义是:

“统计学是一套组织、总结和解释信息的数学过程。”

这句话实际上已经回答了“什么是统计学”这个问题,其中“组织”、“总结”和“解释”是关键词。作为一套数学工具,统计学可以拆分为两个部分,一个用于“整理总结数据”,另一个用于“解释信息”。

用于“整理总结数据”的统计方法被称为“描述统计学”,比如对于学生的数学期末考试成绩,我们可以通过计算平均分,用一个单一的数据就能了解这次考试的平均情况;通过计算标准差,我们可以了解学生考试成绩的集中趋势等等。

用于“解释信息”的统计方法被称为“推论统计学”,同样是数学期末考试的例子,假如为了提高教学质量,从全校某一年级学生中选出60个学生,分成两组,其中实验组A使用新的教学方法,控制组B使用原来的教学方法,一段时间后再次组织考试,然后我们得到两组学生的数学考试成绩,发现实验组学生的平均分比控制组的高,那么这种情况是偶然发生的?还是新的教学方法的确有效果?这个时候就需要使用推论统计学来进行评估了。

上面这个关于教学方法的实验,引出了统计学中的一个基础概念:总体和样本

02

总体和样本

总体表示的特定研究中所关注的所有个体的集合。对于有些研究来说,测量总体中所有的个体显然是不现实的。因此我们必须在研究中抽取出一定的样本来进行研究,这些样本被用来代表总体,我们需要从样本得出结论然后推广到总体。

对样本特征的描述被称为统计量,比如样本平均分,而对总体特征的描述被称为参数,比如总体平均分,它们是一一对应的,然而样本统计量与总体参数是不可能完全相等的,总会出现差异,这个差异被称为“抽样误差”。所以推论统计学就是用来回答“实验中观察到的差异,到底是抽样误差引起的,还是实验方法的确有显著效果”这一问题的数学工具。

不同个体会变化或者有不同值的特征就叫做“变量”。

03

变量

变量有两类,一类是个体的某个具体特征,比如身高,体重和血型;另一类是会影响个体的外部因素,比如温度,湿度和天气情况。当然,也可以将变量分为离散变量和连续变量。进行实验就是对这些变量进行测量和观察,并得到数据集。有一些变量是可以直接测量和观察的,比如上面列举的这些,然而另外一些变量是抽象的,无法直接测量,比如智商,是否感到开心快乐,记忆力等,被称为“假设构建”(Constructs)。

我们可以通过观察和测量一些代表构建的外部行为来完成对假设构建的测量。这样的外部行为被称为“操作定义” ( Operational definitions )。比如通过智力测量分数来衡量智商,通过记忆和识别人脸的正确率来衡量记忆力等等。这些操作定义一方面描述了如何测量构建的操作,另一方面根据测得的结果定义构建。

那么对于变量的测量实际上就是分类或者获得数值。测量分类有两种尺度:称名量表和顺序量表。称名量表用于标注和分类,但没有数量上的含义,比如可以将大学生按专业分为化学,生物,艺术和计算机等等,但“化学”和“艺术”之间不存在“多”或“少”的关系;顺序量表在称名量表基础上多了一层“顺序”的含义,比如“上等”,“中等”和“下等”。

测量数值也有两种尺度:等距量表和等比量表。等距量表具有相对零点,比如测量一组男性身高,以平均身高为零点,高于平均身高1厘米的记为+1,低于平均身高1厘米的记为-1,然而这个时候作为零点的平均身高其测量值的量并不是0;等比量表具有绝对零点,比如测量一组男性身高,仅以厘米为单位,这个时候零点就代表没有高度(绝对零点)。

系统地测量变量的过程,就称为“统计方法”。

04

统计方法

如果我们需要测量每个个体两个非数值型变量之间的关系,我们可以用卡方检验。而如果是数值型变量之间的关系,那么我们可以使用“相关法”对其进行研究,最常见的就是绘制散点图来观察变化趋势。比如图4-1用散点图和线性回归拟合了白葡萄酒残糖量与密度之间的关系。

但相关法的主要局限在于我们只能说明变量之间存在关联关系,但不能说明存在因果关系。其他数值型统计方法还包括假设检验,t检验和方差分析。要想说明因果关系,需要使用“实验法”。

图4-1 白葡萄酒残糖量与密度散点图

如果我们想比较的是两组或多组的成绩,就要使用“实验法”和“非实验研究”。实验法可以建立两个变量之间的因果关系,它的特点在于“操纵和控制”,即操纵被试变量,并控制其他环境变量,降低其影响。比如将抑郁症病人随机分为两组,其中实验组的病人服用新药物,控制组的病人服用安慰剂,一段时间后观察病症改善状况,这个时候“服用新药物”还是“服用安慰剂”就是自变量,“症状改善的病人数量”就是因变量。

非实验研究与实验法的主要区别在于它仅仅观察,而不“操纵和控制”,常见的有非等效组研究和前后测研究。非等效组研究的一个例子比如以性别作为被试变量进行分组,因为性别是天生固有的性质,研究者并不是通过将实验对象分为两组,然后一组定义为女性,一组定义为男性来实现的,并没有“操纵和控制”,所以它不是实验研究;前后测研究常常与时间有关,比如对同一组病人测量治疗前后的康复情况,也属于非实验研究,理由同上。

来源:爱数据原统计网

转自:爱数据原统计网

●SQL你会用WHERE和LIMIT吗?

●10大Python数据可视化库!

后台回复“入群”即可加入小z数据干货交流群

数分统计学基础知识框架。相关推荐

  1. 硬件设计从0到1之基础知识框架

    **硬件工程师从0到1--<基础知识框架>****开篇语** 笔者自2011年从本科毕业至今已经近8年,目前从事与硬件产品经理相关工作,主要面向于B端产品(B端:企业用户).整个岗位职责经 ...

  2. 计算机知识怎么做框架,计算机基础知识框架.ppt

    <计算机基础知识框架.ppt>由会员分享,可在线阅读,更多相关<计算机基础知识框架.ppt(25页珍藏版)>请在装配图网上搜索. 1.计算机基础知识讲座,硬件组成 软件系统 网 ...

  3. 数模备战——基础知识笔记

    数模基础知识 前言 一.数学模型 分类 理解误区 模块 论文结构 备战准备 二.Matlab 简介 帮助系统 变量 数据类型 运算符 函数 向量 多项式 矩阵 符号运算 二维绘图 三维绘图 文件类型 ...

  4. CSS基础知识: 框架

    CSS基础知识整理 框架 box 文章目录 CSS基础知识整理 框架 box 长度单位 颜色单位 框架(盒子) 边框 border 外边距 margin 外边距和并(垂直布局) overflow 高度 ...

  5. 计算机基础知识和实践技能300分,计算机基础知识论文

    随着高等职业教育的蓬勃发展,培养大量高素质的技能型人才是我国国民经济发展的迫切需要,是高等教育大众化的要求,是促进就业.构建和谐社会的有效措施.下面是学习啦小编为大家整理的计算机基础知识论文,供大家参 ...

  6. 分库分表基础知识总结

    为什么要分区,分表和分库? 随着互联网产品在体量和规模上日益膨胀,无论是Oracle还是MySQL,都会第一时间面临来自磁盘.CPU和内存等单机瓶颈,为此,产品方除了需要不断购买成本难以控制的高规格服 ...

  7. 统计学中p值计算公式_不得不学的统计学基础知识(二)

    接上一期的分享,今天继续学习统计学的相关知识,今天涉及到的五个知识点主要包括离散型概率分布.连续型概率分布.假设检验.假设检验的运用(一类错误与二类错误)以及相关.因果以及回归关系.楼主整理了网友们分 ...

  8. 实例讲解统计学基础知识(4):参数估计

    作者:xxw9485 时间:2018/3/20 来源:https://www.jianshu.com/p/7e556f17021a 参数估计 统计学有两大主要分支,分别是描述性统计学和推断统计学.描述 ...

  9. 数模电路基础知识 —— 5. 常见电路符号说明(三极管)

    文章目录 0. 什么是三极管 1. 双极性晶体管(BJT) 2. 场效应晶体管(FET) 2.1. 结型场效应管(JFET) 2.2. 绝缘栅极场效晶体管(IGFET) 0. 什么是三极管 说到三极管 ...

  10. 统计学基础知识(三)

    假设检验 一.假设检验的一般流程 假设检验是统计推断的重要组成部分.下面从一个例子开始讲解假设检验.某公司声称他们发明了一种治疗打鼾的新药物鼾克,并断言能在两周内治愈90%的患者.某外科诊所的医生给病 ...

最新文章

  1. 2020-12-29 Matlab自动化控制-Adrc自抗扰控制参数调节
  2. Linux 终端配置
  3. Hive中的数据库、表、数据与HDFS的对应关系
  4. ASP.NET MVC教程四:ASP.NET MVC中页面传值的几种方式
  5. mysql 5.6 command line client闪退_MySQL 5.6 Command Line Client 点开闪退解决方法
  6. python3 urlencode及urldecode
  7. scala语言+Spark学习一箩筐
  8. 鼠标onfocus或onblur效果
  9. ios7 JavaScriptCore.framework
  10. 关于 Google“博客搜索”Ping 服务应用编程接口(API)
  11. 事实证明:市场没有换来任何技术
  12. OpenCV与机器视觉
  13. 人肉搜索将被禁止,大家要保护好自己的个人信息!
  14. iOS一代码搞定定位
  15. 安卓自定义Toast的原理及实现
  16. 链表的实现(C语言)
  17. 优先使用组合而不使用继承
  18. Spring MVC+Spring+Mybatis
  19. 六十六条经典禅语提升人生境界
  20. 我,35岁程序员,离职前是这么做的

热门文章

  1. springBoot+Vue导出Excel
  2. ios开发快速入门教程
  3. 文后参考文献著录规则 自动生成器 HTML
  4. itextpdf 超链接
  5. LQR控制算法推导以及简单分析
  6. 常见免费邮箱 SMTP 服务地址及端口
  7. 【主动轮廓模型(二)】《GVF Snake》算法原理与OpenCV实现
  8. RS232线序问题(研旭手把手教你学DSP)
  9. 腾讯教育 App Flutter 跨端点播组件实践
  10. 高质量发展-协调发展指标体系构建及测算