数据分析中的统计学基础知识
统计学在我们生活中其实运用面还挺广的,比如社会调查的结果分析都会运用到统计学的知识。
我们今天就来分享一下统计学的一些基础的知识。
大致而言,统计学由“描述统计”和“推论统计”两部分构成。
描述统计就是从取得的数据中抽取其特征的技术。
推论统计是将统计学与概率理论相结合。对“无法整体把握的大的对象”或“还未发生而未来会发生的事情”进行推测。
一、描述统计
1、平均值
平均值就是用数据的合计除以数据的个数
平均数还可以通过以下公式求得
平均数=组值×相对频数的合计
2 、方差
偏差=数据的数值-平均值
方差=[(偏差的平方)的合计]/(数据数)
公式:
3、标准差
标准差=方差的均方根
标准差反映组内个体间的离散程度(波动率)。
标准差的含义在统计学中很重要!
标准差越大,数据的离散程度越大,波动越大。
标准差是数据特殊性特殊性额的评价基准
±1倍标准差以内包含约70%数据
一组数据中某个数据的偏差在±1倍标准差左右,可以说这是“平常的数据”
±2倍标准差以外包含约5%的数据
如果在±2倍标准差以外,则可以说是“特殊的数据”
4、正态分布
概率密度函数
连续型随机变量的概率密度函数是一个描述这个随机变量的输出值在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。
正态分布
若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:
X∼N(μ,σ2),
则其概率密度函数为
正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又常常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。
正态分布的特性:
1)正态分布的95%命中区间是(μ-1.96σ,μ+1.96σ)
2)变量X服从平均值为μ,标准差为σ,可以利用公式将其变换为标准正态分布
Z=(X-μ)/ σ
3)变量X服从平均值为μ,标准差为σ的正态分布时,95%的预测命中区间为解不等式
-1.96≤(X-μ)/ σ≤+1.96 所得的范围
5、假设检验
母群体服从正态分布时,可以通过假设总体参数,来检验观测值是否落在95%的命中区间内。通过以下公式可以计算基于假设的总体参数的观测值的范围
-1.96≤(X-μ)/ σ≤+1.96
如果观测值在这个范围内,接受假设,假设成立;如果不在这个范围内,假设被舍弃。
6、区间估计
区间估计针对母群体的总体参数,在假定总体参数的情况下,只集合列现实观测到的数据在观测数据的“95%预测命中区间”的总体参数。根据区间估计缺点的总体参数的范围叫做“95%置信区间”
95%置信区间是这样一种区间:它由各种各样的观测值用相同的方法进行区间估计,其中95%包含正确的总体参数。
二、推论统计
正态分布母群体
正态分布母群体的总体均值为μ,总体标准差为σ时,n个观测数据x的样本均值x的分布仍为正态分布,且样本均值x的期望仍为μ,但标准差为σ/√n(标准误差)
- 已知总体方差,估计正态母群体的总体均值
正态母群体中已知总体标准差为σ时,可以从n个样本估计整体均值μ
保留满足:
-1.96≤(x -μ)/(σ/√n)≤1.96,求得μ的95%置信区间
2、已知总体均值,估计正态母群体的总体方差
1)由n个观测值计算V
2)从卡方分布临界表中求得自由度为n的卡方分布的95%预测命中区间
卡方分布临界值表的行索引为自由度,列索引为概率
值的含义可以理解为自由度为行索引时,大于该值的数据的概率为列索引
例如:对于自由度为5的卡方分布V来说,V的值有95%在“0.8312≤V≤12.8325”中。
3)解不等式求出σ²的95%置信区间。
3、未知总体均值,估计正态母群体的总体方差
步骤:
1)计算样本均值x,根据样本均值计算样本方差s²
s²=[(x1-x)²+(x2-x)²+…(xn-x)²]/n
2)计算统计量W
3)确认的自由度为n-1的W的95%预测命中区间(a≤W≤b)
4)求出σ²的95%置信区间
4、未知总体方差,估计正态母群体的总体均值
步骤:
1)计算样本均值x和样本标准差s
2)计算服从自由度n-1的t分布统计量T
3)根据t分布表查出自由度n-1的T的95%预测命中区间(-α≤T≤α)
例如自由度为10,T的95%命中区间的临界值为2.228,有-2.28≤T≤2.28
4)计算x–的95%置信区间
这四点是统计学中比较常用的基础知识,有比较大的收获吗?有想了解的可以留言哦!
数据分析中的统计学基础知识相关推荐
- 中职计算机基础课堂传统教学,中职计算机基础知识教学创新
刘静月 [摘要]信息化是当今世界经济和社会发展的趋势,以计算机技术为代表的信息技术已经成为拓展人类能力不可缺少的工具,具有越来越重要的地位.中等职业学校在培养未来的高素质劳动者和技能型人才时,使学生掌 ...
- python编程的基本方法有哪些_Python编程中常用的基础知识有哪些?
今天小编要跟大家分享的文章是关于Python编程中常用的基础知识有哪些?正在从事Python相关工作的小伙伴们,来和小编一起看一看本篇文章,希望本篇文章能够对大家有所帮助. 1.正则表达式替换 目标: ...
- 中职计算机基础课教学策略研究,中职计算机基础知识教学方法及教学策略研究.doc...
中职计算机基础知识教学方法及教学策略研究 中职计算机基础知识教学方法及教学策略研究摘要:中职教育的培养目标是造就具有综合职业能力和全面素质的.直接工作在生产.技术.管理和服务第一线的应用型.技能型人才 ...
- day29—JavaScript中DOM的基础知识应用
转行学开发,代码100天--2018-04-14 JavaScript中DOM操作基础知识即对DOM元素进行增删改操作.主要表现与HTML元素的操作,以及对CSS样式的操作.其主要应用知识如下图: 通 ...
- 云计算中的网络基础知识
一.云计算中的网络基础知识 1.这是虚拟化中的网络框架 第一个圆柱形的设备叫路由器 作用:网络的出口(这不是家用的那种路由器,这里的路由器是指企业级的) 第二行的叫三层交换机 作用:连接不同的网段,可 ...
- 提高中职计算机知识教学改革途径,提高中职计算机基础知识教学改革的途径
提高中职计算机基础知识教学改革的途径 来源:用户上传 作者: 摘要:随着科学技术的不断发展,通信技术的也不断改变人们的工作生活方式,而中等职业学校主要的目标就是要培养高素质的劳动者,为适应时代的需求, ...
- 计算机知识枯燥乏味,中职计算机基础知识研究
版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如果有侵权请立即联系:55525090@qq.com,我 ...
- 电子学:第006课——电路中的一些基础知识
index 电子学:第006课--电路中的一些基础知识 教学视频 基础知识:串联和并联 使用欧姆定律 电阻应该取多大 背景知识:导线发热 理论知识:皮肤上的数学 短路: 背景知识:瓦特 背景知识:瓦特 ...
- Java中的线程基础知识
Java中的线程基础知识 1.线程概念 线程是程序运行的基本执行单元.当操作系统(不包括单线程的操作系统,如微软早期的DOS)在执行一个程序时,会在系统中建立一个进程,而在这个进程中,必须至少建立一个 ...
- 数据分析概率及统计学基础
一.数据分析概述 1. 数据分析的概念 数据分析就是分析数据,从一大堆数据中提取你想要的信息.比较专业的回答:数据分析是有针对性的收集.加工.整理数据,并采用统计.挖掘技术分析和解释数据的科学与艺术. ...
最新文章
- Kotlin 使用list.add 时候报错的处理方法
- 18常用web开发 浮动层、提示层代码下载
- php-cgi占用cpu资源过高的解决方法
- 还原时代原声,AI修复老北京再次火爆全网
- iOS多设备分辨率适配
- 第八天2017/04/17(2、❤String类的源代码)
- java的css的块_JavaWeb--了解CSS
- 【Java】BigDecimal
- oracle中dbms_如何在DBMS中找到关系的最高范式?
- android下载图片服务,Android中的背景图片下载需要帮助吗?
- Kubernetes的三种外部访问方式:NodePort、LoadBalancer和Ingress
- CCF NOI1060 雷同检测
- .htaccess文件玩转Rewrite
- java web 开发分层
- 05Oracle P6培训系列:05创建项目
- edk2中的fdf文件简介
- 杂散干扰解决办法_F频段干扰问题的几种解决方案
- 从全球最大同性交友网站抄了一份不一样的2048小游戏
- 【项目1】家庭记账软件
- 【LeetCode】(55)Jump Game(Medium)