一、统计的含义

(一)什么是统计学

定义:统计学是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。

(二)统计分析数据的方法

可分为描述统计和推断统计,两大类。

1、推断统计

是研究如何通过样本数据推断总体特征的统计学方法,内容包括参数估计和假设性检验。

2、描述统计

是研究数据搜集、处理和描述的统计学方法。内容包括如何获取研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与更新,得出所关心的数据特征。

(三)统计的应用

统计是适用于所有学科领域的通用数据分析方法,是一种通用的数据分析语言。

二、数据类型

(一)变量与数据

1、变量

从一次观察到下一次观察会出现不同的的结果,如,温度、教育程度、股市证券、职业、收入等。

2、数据

把观察到的结果记录下来就是数据。

(二)数据类型

1、定性变量(数据)

是从现象的属性来表现现象的特征。如,天气形势、职业、教育程度、产品型号、血型等。定性变量的观察结果称为定性数据。

特点:只能反映现象的属性特点,而不能说明具体量的大小和差异,只有分类特征,没有量的特征。

定性变量可分为分类变量和顺序变量。

(1)分类变量

是指反映现象分类特征的变量。如,职业、血型、性别等。分类变量的观察结果就是分类数据。

特点:

  • 没有数值特征,不能对其数据进行数学计算;
  • 只能用来区分事物,而不能用来表明事物之间的大小、优劣关系。

(2)顺序变量

是指类别具有一定的顺序,个人觉得是一种特殊的分类变量。如,受教育程度、产品等级、治疗效果等。顺序变量的观察结果就是顺序数据。

特点:

  • 不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。
  • 顺序数据的数据之间虽然可以比较大小,却无法计算相互之间大小、优劣、高低的距离。

2、定量变量(数据)

也称为数值变量,可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出具体大小和差异。如温度、收入、分数等。定量变量的观察结果称为定量数据。

特点:都是以数值的形式出现,有些数值型数据只可以计算数据之间的绝对差(绝对距离),而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差(相对距离)。

3、观测数据和实验数据

根据获取数据的方法不同,可分为观测数据和实验数据。

(1)观测数据

是对客观事物进行实地观测所取得的的数据,在数据取得的过程中一般没有人为的控制和条件约束。在社会经济问题研究中,观测是取得数据最主要的方法。

(2)实验数据

一般是在科学实验环境下取得的数据。自然科学研究中所用的数据多为实验数据。

三、数据来源与搜集数据的方法

(一)数据的来源

统计数据资料的来源主要有两种:

  • 通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称之为原始或第一手统计数据。
  • 别人调查的数据,并将这些数据进行加工和汇总后公布的数据,这是统计数据的间接来源,通常称之为次级数据或第二手间接的统计数据。

注:一切间接的统计数据都是从原始的、第一手统计数据过度而来的。

1、数据的直接来源——原始数据

搜集数据最基本的形式就是进行统计调查或进行实验活动。统计调查或进行实验就是统计数据的直接来源。

(1)统计调查

是指根据统计研究预定的目的、要求和任务,运用科学的方法,有计划、有组织的向客观实际搜集资料的过程。

通过统计调查得到的数据,一般叫做观测数据。

(2)实验法

通过实验法得到的数据就是实验数据。

在实验中往往需要将研究对象分为两个组,一个实验组,一个对照组。对实验组的输入变量加以控制或改变,对照组则不加控制。根据两组的输出结果,可以看到输入变量对输出的影响。

运用实验法的注意事项:

  • 实验组和对照组的产生应当是随机的,研究对象的不同单位应当被随机的分配到实验组或对照组,而不应是经过有意识的挑选。
  • 实验组和对照组应当是匹配的,也就是研究对象的背景资料应当是大体相同的,至少不要差异太大。

2、数据的间接来源——次级数据

次级数据(第二手数据)是指由他人搜集和整理得到的统计数据。

次级数据包括:

  • 公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构。如:《中国统计年鉴》、《人口普查资料汇编》、《北京市统计年鉴》、《世界发展报告》等。
  • 尚未公开发表的统计数据,如各企业的经营报表数据,专业调查咨询机构未公开发布的调查结果数据。

注意:如果公开引用未公开发表的数据需要征得数据所有者的同意,同时为自己发的数据负责。

(二)搜集数据的方法

包括,普查、抽样调查、统计报表、重点调查、典型调查

1、普查

(1)定义

普查是专门组织的一次性的全面调查,用来调查属于一定时点上或一定时期内的==社会现象总量。==比如:人口普查、农业普查、经济普查等。

(2)适用范围

适用于搜集某些不能或不适宜定期的全面统计报表搜集的统计资料。以摸清重大的国情、国力。

(3)特点

普查是一种全面调查,也是一次性的专门调查。

(4)优点

资料包括的范围全面、详尽、系统。

(5)缺点

普查的工作量大、耗资也多,时间周期较长,一般不宜经常举行。

2、抽样调查

(1)定义

是一种非全面调查,它是按照随机原则从总体中抽取一部分单位作为样本进行观察研究,以抽样样本的指标去推算总体指标的一种调查。

(2)特点:

  • 样本单位按随机原则抽取,排除了主观因素对样本对选取样本单位的影响。
  • 能够根据部分调查的实际资料对调查对象的总体数量特征进行推断,从而达到对调查总体的认识。
  • 在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。

(3)优点

既能节省人力、财力、物力,又可以提高资料的时效性,而且能取到比较正确的全面统计资料。

抽样调查是一种非全面的、一次性或经常性的专门调查,这种调查方法在市场经济条件下,使用非常广泛。

(4)抽样方法

主要有两种:概率抽样和非概率抽样

① 概率抽样

概率抽样是根据一个已知的概率随机选取被调查者。

常用的概率抽样形式包括:简单随机抽样、分层抽样、整群抽样、系统抽样。

A、简单随机抽样

简单随机抽样是完全随机地选择样本,是最基本的形式。

B、分层抽样

分层抽样是首先将总体分成不同的“层(或组)”,然后在每一层内进行抽样。

C、整群抽样

整群抽样是将一组被调查者视为一个抽样单位,每次抽取时抽出来的是一组(群),而不是一个个体单位。

D、系统抽样

系统抽样又称为等距抽样,是在总体的名录框中每隔一定距离抽取一个被调查者。

② 非概率抽样

非概率抽样是没有完全按照随机原则选取样本单位。

非概率抽样不能保证抽出来的部分单位(样本单位)对总体单位的代表性,不能够由样本的特征准确地推断总体的特征,但是由于该种方法简单、经济,所以也是人们常用的方法。

3、统计报表

(1)定义

统计报表是按照国家统一规定的调查要求与文件(指标、表格形式、计算方法等)自下而上的提供统计资料的一种调查方式。

国家利用统计报表定期地得到全社会的国民经济与社会发展情况的基本统计资料,是国家取得调查资料的方法之一。

(2)分类

① 按照报送范围,统计报表分为全面报表和非全面报表。

  • 全面报表要求调查对象中的每一个单位均要填报。
  • 非全面报表则只要求一部分调查单位填报。

② 按照报送周期,统计报表可分为月报、季报、年报。

  • 月报内容简单,时效性强
  • 年报则内容比较全面。

(3)统计报表的内容

① 表式

表式由国家统计部门根据研究的任务与目的而专门设计制定的统计报表表格,用于搜集统计资料。它是统计报表制度的主体。

② 填表说明

填表说明是对统计报表的统计范围、指标等作出的规定。

对于大型、国有企业来说,利用统计报表搜集数据,具有时间快、成本低的优点,但对于大量的小型、非国有经济单位来说,则难以全面采用统计报表调查。

4、重点调查

(1)定义

重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查。

这些重点单位虽然数目不多,但它们具有所研究现象的总量在总体总量中占据绝大部分的特点。

(2)适用范围

当调查的任务只要求掌握事物的基本概况与基本的发展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,进行重点调查是比较适宜的。

(3)优点

重点调查可以节省人力、财力,而且及时。

5、典型调查

(1)定义

典型调查是一种非全面的专门调查,它是根据调查的目的与要求,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查。

(2)作用

  • 补充全面调查的不足
  • 在一定的条件下可以验证全面调查数据的真实性

(3)优点

灵活机动、通过少数典型即可取得深入、详实的统计资料。

(4)缺点

由于受“有意识的选取若干有代表性”的限制,在很大程度上受人们主观认识上的影响。

典型调查必须同其他调查结合起来使用,才能避免出现片面性。

各类统计调查方法的特点对比

调查范围 调查时间 收集资料方法
普查 全面 一次 采访、报告或空间遥感
抽样调查 非全面 经常或一次 直接观察或采访
统计报表 全面或非全面 经常 报告
重点调查 非全面 经常或一次 报告
典型调查 非全面 一次 采访

统计学_第一章_统计和数据相关推荐

  1. ArcGIS for Desktop入门教程_第一章_引言 - ArcGIS知乎-新一代ArcGIS问答社区

    原文:ArcGIS for Desktop入门教程_第一章_引言 - ArcGIS知乎-新一代ArcGIS问答社区 1 引言 1.1 读者定位 我们假设用户在阅读本指南前应已具备以下知识: · 熟悉W ...

  2. 《数据结构》_第一章_绪论_蜂考_复习资料_严蔚敏、李冬梅、吴伟民编著

    本文章部分资料来源:蜂考_数据结构_pdf,本文章不用于商业用途,仅用于自学,侵删

  3. 密码(图解密码技术)_第一章_环游密码世界总结

    解释一下啊:我发现我没有段落空两字的时候已经不想改了,原谅我懒,这系列后面也是这样的(任性). 本书中的主要角色: Alice_一般角色 Bob_一般角色 Eve_窃听者 Mallory_主动攻击者 ...

  4. 高数_第一章_第二节_极限

    极限(重难点) 一.考试概要 极限的概念 1)数列的极限 ε 限 制 两 者 的 范 围 , N 用 来 表 示 数 列 以 后 的 项 部 分 列 极 限 必 须 相 等 才 能 成 为 数 列 极 ...

  5. ppt_第一章_德塔自然语言图灵系统

    开始组织核心ppt文字描述,图片和源码 在书籍中已经很丰富了. 第一章_德塔自然语言图灵系统 第一章_德塔自然语言图灵系统 分词,排序,神经网络索引,搜索,动态 POS函数流水阀门细化遍历 内核匹配, ...

  6. 微服务笔记:第一章_微服务简介|Eureka注册中心|Nacos注册中心|Nacos配置管理|Feign|Gateway服务网关

    微服务笔记:第一章_微服务简介|Eureka注册中心|Nacos注册中心|Nacos配置管理|Feign|Gateway服务网关 1. 微服务简介 1.1 服务架构演变 1.2 SpringCloud ...

  7. c++语言编程,一个电灯两个开关控制,[理学]四川大学计算机学院精品课程_面向对象程序设计C++课件_游洪越_第一章绪论.ppt...

    [理学]四川大学计算机学院精品课程_面向对象程序设计C课件_游洪越_第一章绪论 主讲教师: 游洪跃 个人主页: /~youhongyue 邮件地址: youhongyao@ 教材:<C++面向对 ...

  8. 马丁福勒《UML精粹》读书笔记_第一章

    马丁福勒<UML精粹>读书笔记_第一章 UML的使用场景 必须遵从UML规则吗? 在上述草图.蓝图的场景下,不必过多强调遵从UML规则.因为我们使用UML的目的是为了一个好的设计,所以应将 ...

  9. 代驾APP_第一章_项目环境搭建_第一节

    代驾APP_第一章_项目环境搭建 文章目录 代驾APP_第一章_项目环境搭建 1-1 创建根项目 一.创建SpringBoot项目 二.覆盖pom.xml文件 1-2 创建根项目 一.创建公共模块 二 ...

最新文章

  1. R语言包_recharts
  2. 货物与产品的区别_详解海外仓与保税仓的区别特点!
  3. 作业19——夜间模式的开启与关闭,父模板的制作
  4. Python是一门什么样的语言
  5. List集合的remove一个对象的方法
  6. .NET IDE Rider公布2020.2路线图
  7. Android之Toolbar的三个问题:修改左边箭头颜色、怎样修改右边以及子activity中的toolbar添加返回箭头
  8. inotifypropertychanged接受不执行_scp客户端现多个漏洞,可执行恶意脚本
  9. eBPF BCC 实现UNIX socket抓包
  10. xShell终端中文乱码完全解决方法
  11. 安装Matlab2016a中文破解版教程
  12. 数学女孩-伽罗瓦理论读书笔记尺规作图
  13. java计算机毕业设计小型企业财务报销管理源码+lw文档+系统+数据库
  14. Openrefine mysql_openrefine 2.5稳定版-OpenRefine下载(数据清洗工具) 2.5 官方稳定版 - 河东下载站...
  15. 有关git commit --amend的用法及若干个问题
  16. LeetCode-Python-274. H指数
  17. 跨namespace通信
  18. 云计算与大数据考试重点
  19. VS2017中创建使用 XRM 工具常用登录控件的WPF应用程序,适用CRM9.X版本
  20. 学徒浅析Android——Android7.0(N)对于自定义证书和非CA机构证书的适配校验

热门文章

  1. Hierarchy Viewer
  2. 日系插画学习笔记(六):日系角色脸部画法-2头发
  3. 易佳佳能MOV视频恢复软件
  4. CE认证的流程有哪些?
  5. 超详细的OpenCV3.0.0环境配置以及C++编译动态链接库,以及C#的调用
  6. Electron笔记
  7. python3爬虫登录微博(requests)
  8. JAVA扫码点餐(4)-遗留问题
  9. STM32相关驱动和软件下载
  10. 微信平台服务器要求,公众号服务器配置需要启用吗