基于统计学的商务与经济数据分析知识
以下基于统计学视角,对商务与经济的数据分析知识进行总结:
(1)数据
元素(数据来源的原有实物(体))、变量和观测值
度量尺度
定性和定量数据
截面数据和时间序列数据
(2)描述性统计
①表格法和图形法
汇总定性数据(柱状图和饼状图)
汇总定量数据(点位图(横轴表示观测值得取值范围,每一个观测值由位于横轴上的点表示)、直方图、累积分布、累积曲线)
探索性数据分析(茎叶图)
交叉分组列表和散点图
②数值方法(位置、变异程度、探索性数据分析(五数概括、箱形图)、两变量间关系、加权平均)
(3)统计推断
点估计
区间估计
一个总体均值:①大样本下总体均值区间估计,用z分布,如果总体方差未知,则用样本方差s代替;②小样本下总体均值区间估计,假定总体服从正态分布,则总体方差已知情况下,用z分布,总体方差未知用样本方差代替,且用t分布
两总体均值(独立样本):①大样本下,用z分布,如果两总体方差未知,则用样本标准差代替;②小样本下,用t分布
两总体均值(匹配样本):使用样本标准差,t分布
(4)假设检验
判断总体分布情况(泊松分布、正态分布),均可用拟合度检验先后表示用泊松分布、正态分布概率公式求得的总体频数预期结果值。
(5)方差分析
①k个总体均值相等性检验分子、分母分别表示组间、组内均方差;多重比较:费舍尔(Fisher)LSD法( Least-Significant Difference, 最小显著差异法, 用t检验完成各组均值间的配对比较的方法);
②实验设计:纯随机设计(方差分析F检验)、随机区组设计(样本在某一水平进行了重复观测,SST=SSTR+SSBL+SSE)、因子试验(SST=SSA+SSB+SSAB+SSE)
(6)简单线性回归
①最小二乘法估计系数;
②判定系数(判断估计回归方程的拟合程度)
④利用回归方程估计与预测:点估计、区间估计
⑤残差分析:
残差图;
残差正态概率判断图(首先得到标准正态分数表,然后将被检测的标准残差序列从大到小依次和该分数表进行比对,可以得到残差正态分布检测图);
检测异常值(散点图,软件包)如果一个观测值与其他数据的形状偏离很大,那么对应的标准残绝对值也将很大;
高杠杆率点,指自变量的值是极端值的观察值。可以根据自变量的值与它们的平均值距离的远近确定一个观察值的杠杆率(对于只有一个自变量的情形)
⑥多重共线性(两变量相关系数大于0.7或者小于-0.7,将可能产生多重共线性)
⑦变量选择逐步回归、前向选择、后向消元)
⑧自相关性:杜宾-瓦特森(DW)检验
(7)预测
加权移动平均法
消除季节影响的时间系列来分析趋势
回归分析
定性预测(德尔菲法、专家判断法、远景规划法)
(8)非参数法
用于一个主体前后变化比较,或者两个主体差异比较。
①符号检验(signtest)
针对的是正号或负号的符号个数。
小样本,根据发生概率得到二项概率分布表,利用二项概率分布进行检验;
大样本,近似正态分布z检验
②威尔克科森符号秩检验
基于匹配样本,针对的是正负符号个数的差值。
当,使用近似正态分布z检验。
③曼-怀特尼检验:
所使用的两个独立样本来自不同的总体。
小样本,,,;大样本,近似正态分布z检验
④克鲁斯卡尔-沃利斯检验:多个总体
⑤秩相关:
使用斯皮尔曼秩相关系数(spearman 等级相关系数)求解品质相关系数。
秩相关显著性检验(,使用近似正态分布z检验)
基于统计学的商务与经济数据分析知识相关推荐
- 大数据应该这样学:数据挖掘与数据分析知识流程梳理
编辑文章 数据挖掘和数据分析的不同之处: 在应用工具上,数据挖掘一般要通过自己的编程来实现需要掌握编程语言:而数据分析更多的是借助现有的分析工具进行. 在行业知识方面,数据分析要求对所从事的行业有比较 ...
- 基于大数据方法的经济研究:前沿进展与研究综述 | 特别推荐
基于大数据方法的经济研究:前沿进展与研究综述 李华杰 史丹 马丽梅 摘要: 随着数据挖掘和分析技术的不断提高,基于大数据方法对经济的研究日益增多,大数据对经济研究和应用具有重要的现实意义.本文梳理了近 ...
- 包邮再送500份!我们自制了一张【数据分析知识鼠标垫】,抓紧领取
之前,我们自制了一款<数据分析全栈知识鼠标垫>,做了500张送给粉丝,很快就抢没了,获得了不错的反馈,来看看大家的晒图: 感谢粉丝们的口口相传,这张鼠标垫现在也算小有名气了,现在还经常有读 ...
- 数据分析知识体系与校招时间线
一.数据分析知识体系整理 1.统计学(数据分析核心理论基础之一) 具体知识点: 统计学两大基础定理:大数定理,中心极限定理 常见分布的图像,性质与应用(ex. 正态分布,泊松分布-) 假设检验 &am ...
- 基于Hadoop的基因组测序大数据分析平台研究
声明:基于Hadoop的基因组测序大数据分析平台研究是本人2018年的本科毕业设计课题,根据网络资源和自己的专业知识,独立完成整个流程设计.平台搭建和单元测试等工作.本系列文章是对该项目的一个整理总结 ...
- 基于C2C的商务管理系统 JSP+MYSQL C2C购物商城SSH
摘要:本文简要地介绍了基于C2C电子商务系统设计的开发语言和开发工具,以及对C2C电子商务系统的需求分析及实现功能分析.系统的主要界面及后台数据库设计和系统最终的测试运行过程,并运用这些系统开发语言及 ...
- 毕业设计 题目:基于大数据的共享单车数据分析
文章目录 0 前言 1 项目背景 2 项目分析思维导图 3 项目分析具体步骤 3.1 读取数据 3.2 数据分析 3.1.1 数据预处理--每日使用量分析 3.1.2 连续7天的单日使用分析结论 3. ...
- 统计学基础专栏01---探索性数据分析
统计学基础专栏01-探索性数据分析 0.术语 0.1.探索性数据分析 连续型数据 数据可在一个区间内取任意值 离散型数据 数据只能取整数,例如计数 分类型数据 数据只能从特定集合中取值,表示一系列可能 ...
- Flink从入门到精通100篇(十九)-基于 Flink 的大规模准实时数据分析平台的建设实践
前言 如何基于 Flink 搭建大规模准实时数据分析平台?在 Flink Forward Asia 2019 上,来自 Lyft 公司实时数据平台的徐赢博士和计算数据平台的高立博士分享了 Lyft 基 ...
- 基于Flink+ClickHouse构建实时游戏数据分析最佳实践
简介:本实践介绍如何快速收集海量用户行为数据,实现秒级响应的实时用户行为分析,并通过实时流计算.云数据库ClickHouse等技术进行深入挖掘和分析,得到用户特征和画像,实现个性化系统推荐服务. 直达 ...
最新文章
- 5g信号云端服务器,随着5G万物互联的到来,云服务器迎来新机遇
- 为什么交叉熵和KL散度在作为损失函数时是近似相等的
- Jmeter响应结果unicode转成中文显示
- MySQL查询表内重复记录
- iqueryable怎么进行操作_C# 数据操作系列 - 16 SqlSugar 完结篇(最后的精华)
- idea设置打开文件窗口个数
- 解决:AttributeError: module 'pygal' has no attribute 'Worldmap' 问题
- Android笔记(三十六) AsyncTask是如何执行的?
- java生产者实现kafka拦截器
- JAVA线程池_并发队列工作笔记0001---认识阻塞队列_非阻塞队列
- pytorch一天速成第一部分——基础入门Tensor和cuda
- Netty入门(九)空闲连接以及超时
- 穿越剧_零差评的5部穿越剧,少有的巅峰之作,第一堪称穿越鼻祖!
- 国内首份千款主流安卓应用耗电指标评测报告新鲜出炉!
- linux中线程的问题,linux中的线程问题
- web developer tips (71): 关于FastCGI 1.5beta几个新配置设置
- Android入门笔记06
- C语言 输出乘法口诀表
- 【埋点体系】(一)-埋点的理解
- iOS 图片编辑——涂鸦——在图片上添加文字