统计学:统计基本概念
1.统计学含义
统计学,是一门关于数据收集、处理、分析、解释,并从数据中得出结论的科学。
- 数据收集:取得数据
- 数据处理:用图形等形式展示数据
- 数据分析:利用统计方法分析数据,并从数据中提取有用信息得出结论
- 数据解释:对分析结果的说明
- 得出结论:从数据分析结果中得出客观结论
2.描述统计与推断统计
如下图所示,数据分析方法分为描述统计方法和推断统计方法。
2.1 描述统计
描述统计,是研究数据收集、处理、汇总、图表描述、概括与分析等统计方法。
- 收集数据
- 整理数据
- 展示数据
- 描述性分析
作用:
- 描述数据的特征
- 找出数据分布的规律
2.2 推断统计
推断统计,是用样本数据来推断总体数据特征的统计方法。
- 参数估计
- 假设检验
作用:推断总体数据分布的规律。
3.数据类型
统计数据,是对研究对象进行观察所得的结果。以人口性别测量为例,可得性别为男或女的观测值。
3.1 按计量尺度分
分类数据:非数字型数据,是研究对象进行分类而得的结果,用文字描述。在数据处理中,可将分类数据进行编码。比如,人口的性别分类结果为男或女,可用1表示“男”,0表示“女”。
顺序数据:有序的分类数据。比如,产品品级可分为一等品、二等品、三等品等,可用1、2、3等数字来表示。
数值型数据:用数字表示的观测值。
分类数据和顺序数据,统称为定性数据,用来说明研究对象的品质特征;
数值型数据,称为定量数据,用来说明研究对象的数量特征。
区分数据类型的意义
不同类型的数据,用不同的统计方法来处理。
- 分类数据:计算各组的频数或频率,众数和异众比率,列联表分析,卡方检验等。
- 顺序数据:计算中位数和四分位差,等级相关系数等。
- 数值型数据:计算统计量,参数估计,假设检验等。
3.2 按收集方法分
观测数据:在没有人为控制的条件下,对研究对象进行调查或观察而得的数据。
实验数据:在实验中、有目的的控制实验条件下,对研究对象进行实验而得的数据。
3.3 按时间状况分
截面数据:在不同的空间,在相同或近似的时间点上收集的数据。用来描述现象在某一时刻的变化情况。
时间序列数据:按时间顺序,在不同的时间收集的数据。用于描述现象随时间变化的情况。
4.统计基本概念
4.1 总体和样本
总体,研究的全部个体。
- 有限总体:个体的数目可数。
- 无限总体:个体的数目不可数。
总体分类的意义:判断每次抽样是否独立。
- 对无限总体,每次抽样都不影响下一次的抽样结果,可把每次抽样看做是独立的。
- 对有限总体,每次抽样后,总体中的个体数就减少一个,前一次的抽样会影响下一次的抽样结果,所以每次抽样都是不独立的。
样本,是从总体中抽取的部分个体,其数目为样本量。
抽样,是为了根据样本信息推断总体特征。
4.2 参数和统计量
参数,描述总体特征的数字。
统计量,描述样本特征的数字,是根据样本数据计算出来的,是样本量的函数。
总体参数 | 样本统计量 | |
---|---|---|
μ\muμ | 平均数 | xˉ\bar xxˉ |
σ\sigmaσ | 标准差 | sss |
π\piπ | 比例 | ppp |
4.3 变量
变量,描述现象的特征。
- 分类变量:说明事物类别的名称,值为分类数据。比如,“性别”是分类变量,其变量值为“男”或“女”。
- 顺序变量:说明事物有序类别的名称,值为顺序数据。比如,“产品品级”是顺序变量,其变量值为“一等品”、“二等品”、“三等品”等。
- 数值型变量:说明事物数字特征的名称,其值为数值型数据。可分为离散型变量和连续型变量。
统计学:统计基本概念相关推荐
- 方差,协方差 、统计学的基本概念
一.统计学的基本概念 统计学里最基本的概念就是样本的均值.方差.标准差.首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述: 均值: 标准差: 方差: 均值描述的是样本集合的中间点,它告 ...
- 数据分析师都了解的统计基本概念
本文讲述了数据分析师应当了解的五个统计基本概念:统计特征.概率分布.降维.过采样/欠采样.贝叶斯统计方法. 从高的角度来看,统计学是一种利用数学理论来进行数据分析的技术.象柱状图这种基本的可视化形式, ...
- UA MATH566 统计理论 概念与定理总结
UA MATH566 统计理论 概念与定理总结 Part 1 Exponential Family Tip 1: Form of Exponential Family f(x∣η)=h(x)exp( ...
- 统计学习方法(—)——统计学习方法概念
1.统计学习方法概念 统计学习方法包括模型的假设空间.模型选择的准则以及模型学习的算法,称统计学习方法的三要素,简称为模型.策略和算法. 模型的假设空间:包含所有可能的条件概率分布或决策函数. ...
- 概率图与随机过程:概率统计基本概念与人工智能应用之间的桥梁
在机器学习算法的修炼道路中,概率图模型和随机过程对很多同学而言是一个巨大的拦路虎.很多同学会有这样一种感觉:这里面所涉及的模型概念可是真多啊!三两下就给整蒙了: 概率模型.图模型还没整明白,又来了个概 ...
- 统计学入门基础概念问答(统计学方法的分类、统计数据的分类等)
1.统计学概念 什么是统计学?(statistics) 统计学是收集.分析.表述和解释数据的科学(不列颠百科全书). 2.统计学方法的分类 描述统计学 (descriptive statistics) ...
- 机器学习基础-概率和统计基本概念
记录概率和统计相关的概念和基础知识 总体来说 概率和统计是互逆的: 概率根据数据生成的过程进行建模,研究某种模型产生的数据有什么特性, 统计学正好相反,通过已知的数据,来推导产生这些数据的模型是怎样的 ...
- 统计学中基础概念说明
如果觉得文章写得好,如果你想要博客文章中的数据,请关注公众号:[数据分析与统计学之美],添加作者[个人微信],进群和作者交流! 目录 1.什么是描述性统计? 2.统计量 1)常用统计 ...
- 数据科学家应当了解的五个统计基本概念
从高的角度来看,统计学是一种利用数学理论来进行数据分析的技术.象柱状图这种基本的可视化形式,会给你更加全面的信息.但是,通过统计学我们可以以更富有信息驱动力和针对性的方式对数据进行操作.所涉及的数学理 ...
最新文章
- Usb-type-C端口实现的挑战与设计方案
- RedHat 7.0 Chrome浏览器 安装
- div模拟textarea文本域轻松实现高度自适应
- 不忘初心helloworld,IMX6入门学习笔记
- 成功解决ConvergenceWarning: lbfgs failed to converge (status=1): STOP: TOTAL NO. of ITERATIONS REACHED L
- Framebuffer 机制
- 基于SegNet和UNet的遥感图像分割代码解读
- c/c++入门教程 - 2.4.7 多态、函数地址晚绑定(重写,虚函数,纯虚函数,抽象类,虚析构,纯虚析构)
- 百度api申请key
- 计算机圆半径计算公式,圆半径计算公式是什么?
- vue react 写法区别
- Android ViewPager放入多个XML如何监听其的控件
- 计算机组成原理——存储器系统
- 网线水晶头制作及标准接法教程,运维必备硬技能
- R语言并行计算beta-NTI值
- Netlink的简单例子
- C语言中的这些经典题目你都会了吗?【一文带你回顾经典】【全程高能】
- FMRI及NMR简介
- mac如何查看是否安装了git?
- 叶子结点和分支节点_什么是叶子节点,度?根节点?