本书的特点是,将数据分析和企业经营管理结合的很好,内容实例很详实,很能印证作者的观点。其中,很多统计学的知识并不新鲜,多数的大学课堂都有学过,但是这些知识和企业的营销方式、管理决策结合起来时,令人耳目一新,使人不自然地对统计学知识产生更鲜活的理解。

1. 数据科学家专业素养

专业素养 原因 备注
重视不同的标准 只有这样才能关注到那些
和目标最相关的标准
《点球成金》中男主比恩选择了上垒率,而不是传统经验的安打率和奔跑速度;
设定并不断完善关键指标 真理本身就需要不断被完善,此外浩如烟海的数据容易让人迷失,我们需要关键的指标来指引数据分析的道路 比恩的副手德波戴斯塔察觉到最重要的两项数据:上垒率和长打率。根据数据分析两项数据重要性,并设定了关键指标:上垒率*3 + 长打率;
懂得企业利润和成长的知识 数据科学家不是只会数据分析的工具人,还要时刻思考自己的工作如何才能为企业创造利润和带来成长 《点球成金》比恩靠着数据分析,打造了一支低成本和高水准的优良球队。
立足商业理论的思考 对商业运营有帮助 (1) 帕累托法则:20%的大客户为公司带来80%的利润;20%的畅销品创造了80%利润;
(2) 平衡计分卡:分治的思想,从基本战略出发,向财务、客户、内部流程和学习成长四个层面一一分解,即实现基本战略的具体落实。
(3) 关键绩效指标KPI:量化每个层面的具体战略的落实情况;
坚持KPI导向数据分析 时刻保持KPI意识和坚持KPI导向数据分析就是在落实公司的战略部署,就是对公司做贡献 数据分析基本流程(不断重复):(1)影响KPI的主要因素;-> (2)分析工作的规划;-> (3)收集与分析数据;-> (4)研究KPI的改善措施;-> (5)提交改善方案;-> (6)将改善方案导入公司;->(7)KPI改善效果确认;-- 反馈–> (1);
五大核心步骤 针对组织发展的瓶颈环节,不优化提高瓶颈环节,再怎么努力,能得到的只有局部最优解,未必会是组织的全局最优解 (1) 找出组织的瓶颈环节,瓶颈环节即其表现下降会拉低整体的水平;
(2)最大限度利用瓶颈环节,再未能改善之前要一直维持其高水平状态;
(3)使企业的所有其他活动服从于约束条件,因为瓶颈环节得不到改善,其他条件改善再多也是无用功;
(4)改进约束条件,即改善瓶颈环节;
(5)重返第1步,谋求组织持续性的改善;这才是真正五大核心步骤的核心;

注:

  1. 管理学家德鲁克认为,企业的职责就是创造顾客和留住顾客;而营销和创新是创造顾客和留住顾客的两个车轮,控制这两个轮子的方向盘就是管理。
  2. 作者认为,数据科学家应该时时刻刻关注企业的利润和企业的成长。
  3. 平衡计分卡:以组织的基本战略为起点,然后再财务方面(保障股东们长期利益)->客户方面(满足客户需求与提升公司效益)->内部流程方面(企业管理效率提升和客户管理的完善)->企业的学习与成长方面(实现内部流程的战略需要什么样的学习和成长战略)等进行分解,落实为一个个具体的战略;
  4. 数据分析的基本流程是管理学的基本PCDA模式:Plan(计划)、Check(检查)、Do(执行)、Act(改善);这个是现代管理的不可或缺部分,但是也要注意它的缺陷;
  5. 常用的KPI有:
财务层面KPI 公式 说明
总资产利润 营业利润/总资产*100% 数值越大越好,反映企业经营状况的一个极其重要的指标
总资产周转率 营业额/总资产(次) 数值越大越好,企业用最小的资本实现最大的营业额才能提高周转率
销售管理费用率 销售管理费用/营业收入*100% 数值越小越好,这项数据反映人工费、广告费等销售管理费用在营业收入中所占的比例,压缩它能帮助营业利润提升
营业利润率 营业利润/营业收入*100% 数值越大越好,要提高营业利润,营业额的提升和销售管理费用的压缩二者缺一不可
流动比率 流动资产/流动负债*100% 现金等流动资产和借款等流动负债的比例关系。这项数据是反映企业稳定性(短期支付能力)的重要指标,一般以200%为宜。
客户层面KPI 公式 说明
市场占有率 企业的销售额/整体行业的销售额*100(或者企业在目标市场销售额/目标市场整体销售额,或者企业的销售额/三个最大竞争者的销售额之和) 反映企业市场地位的重要指标,在兰彻斯特战略中,独占市场份额(73.9%),相对稳定份额(41.7%),顶端份额(26.1%),并列的上位份额(19.3%),市场的影响份额(10.9%),竞争存在份额(6.8%),市场桥头堡份额(2.8%)。
细分市场占有率 同上,分子变成是产品 评价标准同上
客户满意度 一般通过问卷调查形式直接获得 反映客户对企业产品或服务满意程度的重要指标
客户忠诚度 综合指标:最近购买时间、购买频率、累积购买金额;
互联网应用:最近访问时间、访问频率、平均访问停留时间、平均访问页面数
要综合多个因素才能评估用户的忠诚度,也就是说这个事情很复杂,不是单一维度数据能够说明清楚的。
内部流程层面KPI 公式 说明
存货周转率 营业收入/存货余额(次) 反映库存资产(产品、半成品、零部件)周转率的指标。这些资产的在库周期越短,周转率越高,进而有助于总资产周转率、总资产利润率的提升
员工人均营业收入 营业收入/员工人数(元) 数值越大越好
退货率 退货数量占销售产品数量的比例 退货率是反映产品质量的重要指标
生产周期 产品或服务从投产到产出的时间 在提升产品品质的同时缩短产品周期是内部流程管理永恒的主题。代表性指标有丰田的JIT

注:JIT生产方式(JIT,Just in time,实时生产方式) ,其实质是保持物质流和信息流在生产中的同步,实现以恰当数量的物料,"在恰当的时候进入恰当的地方,生产出恰当质量的产品。这种方法可以减少库存,缩短工时,降低成本,提高生产效率。具体介绍的链接:https://wiki.mbalib.com/wiki/JIT

学习和成长层面KPI 公式 说明
员工满意度 这个也很复杂,一般选公司食堂的利用人数等作为指标 管理学家指出,要提升顾客的满意度,必须要提升员工的满意度
员工维持率 正式员工平均多少年会离开公司 员工维持率和员工满意度有着很大的联系,黑心企业的员工维持率很低
教育/培训时间 单纯时间累加 并非越长越好,但必要程度的教育/培训是不可缺少的
资格获得率 多少员工获得与自己工作相关的资格数/公司员工数 对敦促员工提升和留住优秀人才很重要

2. 统计学能做啥?

1.描述性统计:产品或服务的质量和稳定性
关键指标1:均值和极差;均值集中趋势、而极差表征该组数据的离散程度;在营收上就是,极差表示营业的稳定性,极差越小营业越不稳定;但是极差只适合同等量级的数据;
关键指标2:标准差;可以比较相同度量单位,但是不同量级的群组数据的离散程度;标准差表示各个数据点到平均值的离散程度,因此,标准差无法用于比较度量单位不同或者是平均值不同的数据集的离散程度;
关键指标3:变异系数(标准差/平均值);可以比较均值不同或者度量单位不同的数据集的离散程度;
总之,极差、标准差和变异系数都是用来比较数据集的离散程度的,只是相应的应用数据集的度量单位或均值会有所不同;此外,偏差、偏差平方、偏差平方和和方差也是刻画数据集的离散程度。例子见这个下载链接
2. 标准正态分布能有啥用?-- 产品质量管理
(1) 估计数据分布概率:服从正态分布的数据集都有三个数据分布特征:1)任意数据落在(均值 ±\plusmn± 1个标准差)内的概率为68.3%;2)任意数据落在(均值±\pm± 2个标准差)内的概率为95.4%;3)任意数据落在(均值±\pm± 3个标准差)内的概率为99.7%;应用在库存管理上的例子,如果某个产品的销量满足正态分布,那么只要将库存保持在(平均销量±\pm± 2个标准差)就有95.4%的概率防止缺货,如果将库存保持在(平均销量+2个标准差),那么就能保证有95.4% + 4.6%/2 = 97.7%(只考虑正态分布的右侧)
(2) 估计某个数据点X在数据分布上的位置:1)Z分数 = X−XˉS\frac{X-\bar X}{S}SX−Xˉ​, 其中,SSS是样本标准差S=∑(Xi−Xˉ)2n−1S=\frac{\sqrt{\sum{(X_i -\bar X)^2}}}{n-1}S=n−1∑(Xi​−Xˉ)2​​,Xˉ\bar XXˉ是样本均值;Z分数的作用估计某个数据X在标准正态分布中的位置。2)T分数作用估计某个数据X在均值为50,标准差为10的正态分布中的位置。T=50+10Z。所以,将某个学生的考试成绩减去均值后再乘以10,然后除以标准差,再加上50,就得到T分数。知道了T分数就知道了某个学生成绩在班级的位置了。
(3)6σ\sigmaσ品质管理。一种防范产品偏差,维持产品质量生产管理方式的一种。不同于(1)中的3个标准差范围,这里是6个标准差范围,任意数据落入这一范围的概率是99.99966%。也就是说百万产品中只有3.4个是废品。最早由摩托罗拉公司提出,为了落实六西格玛产品质量管理目标,摩托罗拉公司配套有管理措施:MAIC步骤;即measure(测量)->analyze(分析)->impore(改进)->control(控制)->measure(测量),是一个闭环管理。
3. 相关分析能干啥? – 高效经营:挖掘潜在的商机和给出改善服务和产品质量的对策
(1)挖掘到别人都没有发现的相关关系,就是发现了商业机会,可以帮助公司获取巨大利益;
(2)相关关系和因果关系的区别:因果关系除了要考虑相关关系之外,还必须要时间顺序正确和不存在第三方因素;
(3)相关分析的工具:散点图(相关关系可视化)和相关系数(相关关系强弱性度量);
散点图:数据点向上爬升<->正相关, 数据点向下跌<->负相关,其他<->无关 ;
相关系数:0.7~1 :强正相关;
0.5~0.7:弱正相关;
0.5~-0.5:不相关
-0.5~-0.7:弱负相关;
-0.7~-1:强负相关;
(4)相关分析与业务改善提升客户满意度:基于相关系数-满意度的散点图,对各方面因素进行满意度分析,找出急切需要改善的的地方,以及对其他因素有更清晰的定位和认识;例子见这个下载链接
(5)对顾客和商品进行细分化:面对众多的因素,如何快速高效地选择出和目标相关的因素?— 以探究顾客和在售商品之间的相关关系为例,先通过关键性指标或者选择用RFM指标对客户进行细分,然后对细分后的不同类型顾客进行交叉分析,从中找出明显的变化趋势。
4. 回归分析能干啥?-- 未来预测和各个因素重要性分析
(1)预测未来的产量或销量或营业收入等
(2)一元回归,通过R2R^2R2评定回归方程的可信度,越接近1越可信;
(3)多元回归,通过Adjusted R square评定多元回归的可信度,越接近1越可信。其中,“有意义的F值”评定,代表所有系数为0的可能性,基准值5%,越低于基准值,表明为0的可能性越低,也就是回归方程越安全;P值衡量单个系数为0的概率,评价准则同上。综合,这三个参数可以得出多元回归方程的可信度。
(4)多元回归系数可以解释变量的重要程度,系数越大的,重要性越大。
(5)利用多元回归方程,计算不同策略(变量)选择对销售额的影响。从而确定哪种策略选择是最优的。
5. 假设检验能干啥?-- 检验结论的可靠性,区分不同对等集合(店或旅馆的价格或顾客评价等)均值是否具有显著性差异
(1)假设检验的实质是,放弃构造的小概率事件(因为小概率事件发生概率低,即便是放弃了,风险也低),来选择备择假设,从而达到检验目的。
(2)双边检验:对于(样本均值)2(样本均值)^2(样本均值)2这类服从正态分布的统计量,进行双边检验,拒绝域两侧都有。
(3)单边左侧检验:拒绝域在左侧,右侧都是接受域;
(4)单边右侧检验:拒绝域在右侧,左侧都是接受域;
(5)样本量小,选择t检验
(6)均值是否有显著性差异:1)样本容量大的两个集合均值差异检验,Z统计量的检验。2)样本容量小的两个集合均值差异检验,t检验;3)多个集合的均值差异检验, F检验,利用F分布的检验叫方差分析。方差分析要干的事情是:比较组间的离差平均值是否能够足够大于组内离差,一致使得各个组能被区分开来。也就是说,如果组间平均离差距离远远大于组内离差的话,那么各组几乎没有交集,即每个组都能被明显区分开来,这个就是说各个组均值存在显著性差异。否则就是不存在显著性差异,即每个组大部分相互重叠,像是一个组一样。4)组内离差:组内数据点到组内均值距离的平均值;组间离差:某个组均值到总体数据均值的距离。5)方差分析的软件参数解读:P值,F值,F临界值。第一步,确定虚无假设是否要放弃,P值如果低于显著性水平则放弃虚无假设。虚无假设:没有差异;备择假设:有显著性差异;第二步,是否在拒绝域内?确认F值是否超过F临界值,对于F分布来说,如果超过表明F值落入了拒绝域。

数据化决策-数据分析与高效经营1相关推荐

  1. 拉卡拉智能POS助力中小商户高效经营

    拉卡拉智能POS助力中小商户高效经营,近些年来,移动支付发展迅速,像一股浪潮一般席卷全国各地,商户们再也不用为现金找零发愁,收款效率得到极大的提高.但是面对越来越多的支付方式,商户也面临新的困扰.微信 ...

  2. 如何打造数据化决策管理

    系统独立.数据分散.缺乏统一管理,是很多企业信息化过程中面临的问题.随着市场进程的加速,业务的扩展,企业数据量呈指数上涨.一方面给企业的数据管理带来了挑战,另一方面也让企业重新审视了数据利用的价值. ...

  3. 不容错过的Pandas小技巧:万能转格式、轻松合并、压缩数据,让数据分析更高效...

    点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 作者 | Roman Orac 转自 | 量子位    编译 | 鱼羊 数据分析,如何 ...

  4. python药店销售数据分析_药店经营数据分析案例

    关于 XX 药店 09 年 1~7 月经营数据简析 雪域飞花 受 XX 药店委托, 我们对企业 09 年 1`7 月的经营数据通过瑞商源数据分析系统进行了计 算分析,现将分析结果列示如下: 一.销售数 ...

  5. @餐饮店老板!如何高效经营?智掌柜点餐收银机了解一下

    在科技手段不断更新的今天,很多餐厅还在使用传统的收银机,导致门店工作效率低,客人用餐体验不佳,最终收益可能也是越来越低.Come on!苹果手机都更新到第12代了,你还不赶紧升级店里的收银设备! 小编 ...

  6. 美国开餐馆需要什么证件?怎么让餐馆高效经营?

    从第一批华人漂洋过海踏上美国的这片土地以来,开餐馆一直是众多华人谋生的选择,即使是现在,中餐馆在美国的餐馆中依然占据着较大的比重.那么,在美国开餐馆需要什么证件呢?除了证件,有还需要准备些什么呢? 同 ...

  7. 数据化决策(期末复习)

    第一章 预测概述 预测:根据事物的客观发展趋势与变化规律,对特定的对象未来发展的趋势或状态做出科学的推测与判断 预测的5大基本原理 系统性原理. 以系统的观点为指导,采用系统分析,实现预测的系统目标. ...

  8. 微博数据分析及高效获取

    新浪微博API 1.用户个人资料 2.用户社交关系 3.微博信息 4.无法获取关键字搜索微博数据,获取微博全面的评论,转发的少量信息,无法获取赞信息 爬取 1.用户个人资料 2.获取关键字搜索微博数据 ...

  9. Adventure项目可视化报表

    一.项目介绍 Adventure Works Cycles是一家生产和销售自行车及其附带产品的大型跨国制造公司,通过现有数据监控商品的线上和线下销售情况,获取最新的商品销售趋势以及区域分布情况,并进行 ...

最新文章

  1. 高校计算机实验管理人员会议,计算机科学学院召开实验室安全与管理工作会议...
  2. 转换输入文本中的回车和空格
  3. 【学习笔记】线段树的数组大小下限及证明
  4. 逆向与汇编的一些笔记
  5. 前端学习(2946):vue-cli使用
  6. android 拍照屏幕大小,Android Camera 找出屏幕的最佳尺寸大小
  7. JavaScript对象的深入理解 (一)
  8. Aspose.Words对于Word的操作
  9. 流程管理的流程与角色
  10. 卷积云神经网络_有卷积云的北京天空好美!是不是还有池化云?全连接云?
  11. 编译OpenJDK12:test_json.cpp error C2143 语法错误
  12. 【十五分钟Talkshow】如何理解并优化.NET应用程序对内存的使用
  13. oracle oci.dll无法加载_性能优化专题11-类加载器
  14. SQLEXPRESS服务无法启动
  15. 大数据集群资源监控Zabbix
  16. VCL组件DevExpress VCL v21.1 - 全新的甘特图控件
  17. setuptools-scm was unable to detect version for‘…/…/某git包‘
  18. hive 元数据 解释
  19. 椭圆 标准方程 离心率 圆的标准方程
  20. 鸿蒙os系统测试版照片,鸿蒙OS正式发布:荣耀智慧屏首发,一起来体验鸿蒙OS吧...

热门文章

  1. spring的工作原理介绍
  2. 微信小程序图片处理方案,解决加载缓慢,影响用户体验
  3. 将私人对话发布到公共空间来寻求正义是否可取
  4. 用C语言判断输入年份是否为闰年
  5. [附源码]Java计算机毕业设计SSM大学生健康管理系统的设计与实现
  6. 几种python入门级OCR开源库中文识别效果对比
  7. iOS使用libxlsxwriter导出excel文件
  8. uni-app开发微信小程序常见问题(更新版):uni.getUserProfile要怎么写?uni.login和uni.getUserProfile的顺序?
  9. oppo reno7参数配置
  10. 阿里云服务器能做小程序吗