分布分析用于展现同一维度下不同个体的分布情况。例如,散点图、直方图就是分布分析的普遍应用。

本章内容涵盖次数分布分析、时间分布分析、合计百分比分布分析等案例。


7.1 次数分布分析

商业场景:

本节案例为分析客户购买次数分布,主要目的在于找出一段时间范围内客户

购买的规律。

图71.1所示为依据客户D统计客户购买次数的分布情况。结果呈现正态分布,

即大部分客户的购买次数为5~7次,分析师可进一步分析这组客户的用户特征,获取更有价值的洞察。

可视化: 柱形图

数据源:示例-超市(订单)

新建表:

客户表 = VALUES('订单'[客户 ID]) //返回以客户ID为唯一值的一张表,要建立连接

新建列:

客户表中:

购买次数 = CALCULATE(DISTINCTCOUNT('订单'[订单 ID]))

新建度量值:

客户不重复计数 = DISTINCTCOUNT('客户表'[客户 ID])


7.2 时间分布分析

商业场景:客户二次购买时间分布分析,用于分析新用户在初次购买后,会在多久发生第二次购买。

如图7.2.1所示,在2015年的第2季度获得的新客户中,有38人在1个季度后会进行第二次购买,矩形的颜色越深,意味着客户数量越密集。

通过分析客户二次购买的时间分布规律,可以为不同客户群提供不同的销售策略,以少流失客户的可能性。

可视化: 矩阵图(Matrix)与表格不同的是,矩阵图的横坐标轴和纵坐标轴都可

设置为维度,横坐标和纵坐标交叉处为矩阵点,可用颜色进行标记,如图7.2.1所示。

数据源:示例-超市

新建表:

客户表 = VALUES('订单'[客户 ID]) //注意要建立连接

新建列:

最初购买日期 = CALCULATE(MIN('订单'[订单日期]))

购买次数 = CALCULATE(DISTINCTCOUNT('订单'[订单 ID]))

第二次购买日期 = CALCULATE( MINX(EXCEPT(VALUES('订单'[订单日期]),VALUES('客户表'[最初购买日期])),[订单日期]))

新建度量值:

客户不重复计数 = DISTINCTCOUNT('客户表'[客户 ID])

客户表
条件格式中高级控件

7.3 合计百分比分布分析

商业场景:本节案例为7.1节的案例的延伸。

分析客户购买次数,仅仅是客户分析的开始。在实际中仍然需要继续细化分析。

例如得出不同购买次数的客户数在总客户数中的占比。

如图73.1所示,这里统计了客户的购买平均次数(比如统计平均每季度购买一次的客户数,平均每两季度购买一次的客户数等),并计算出相应的客户数在总客户数中的占比。

可视化: 柱形图

数据源:示例-超市

新建表:

客户表 = VALUES('订单'[客户 ID]) //注意要建立连接

新建列:

最初购买日期 = CALCULATE(MIN('订单'[订单日期]))

购买次数 = CALCULATE(DISTINCTCOUNT('订单'[订单 ID]))

第二次购买日期 = CALCULATE( MINX(EXCEPT(VALUES('订单'[订单日期]),VALUES('客户表'[最初购买日期])),[订单日期]))

二次购买日期(季度) = DATEDIFF([最初购买日期],[第二次购买日期],QUARTER)

末次购买日期 = CALCULATE(MAX('订单'[订单日期]))

客户成长期(季度) = DATEDIFF([最初购买日期],[末次购买日期],QUARTER)

购买平均次数(箱) = ROUND('客户表'[客户成长期(季度)]/[购买次数],0)

购买平均次数 = '客户表'[客户成长期(季度)]/[购买次数]

新建度量值:

客户不重复计数 = DISTINCTCOUNT('客户表'[客户 ID])

全体购买平均次数 = AVERAGEX(ALLSELECTED('客户表'),[购买平均次数])

与平均值差 = AVERAGE('客户表'[购买平均次数(箱)]) - [全体购买平均次数]

下拉箭头计算百分比

7.4 静态象限图分析

商业场景:很少用到,

可视化: 【Quadrant Chart by MAQ Software

数据源:2019GartnerBI魔力象限.xlsx


7.5 动态象限图分析(略)


7.6 帕累托分析

商业场景:

帕累托分析的原理就是我们日常所说的“80/20”原则,比如企业中80%的

利润来自20%的商品销售;反之,80%的商品创造了20%的利润。

帕累托分析有助于让企业关注利润价值高的商品,同时减少利润少的商品,提升企业的总体利润。

本节使用帕累托分析洞察商品与利润之间的关联。

可视化:

帕累托图( Plato Chart )。帕累托图用于显示合计百分比的分析结果。

在本节实例中,主要计算包含两个维度的合计百分比:产品数量合计百分比和产品利润合计百分比。

数据源:示例-超市

新建表:(注意:关联)

子类别表 = VALUES('订单'[子类别])

新建列:

利润 = CALCULATE([利润求和])

利润排名 = COUNTROWS(FILTER(ALL('子类别表'),EARLIER('子类别表'[利润])<=[利润]))

合计利润 = SUMX(FILTER(ALL('子类别表'),EARLIER('子类别表'[利润])<=[利润]),[利润])

合计利润百分比% = [合计利润]/SUM('订单'[利润])

子类别个数汇总百分比 = [利润排名]/COUNTA('子类别表'[子类别])

新建度量值:

利润求和 = SUM('订单'[利润])

注意:

因为产品过多,所以取掉一些后面的产品。创建子类表再关联。

我使用计算列,避开复杂的度量值计算

完整的帕累托分析

f分布表完整图a=0.01_第7章 分布分析相关推荐

  1. f分布表完整图a=0.01_建筑电气工程图的一般规定

    建筑工程图的格式与幅面尺寸 1.图纸格式 一张图纸的完整图面是由边框线.图框线.标题栏.会签栏等组成的,其格式如图1-1所示. 图1-1 图纸格式示例 (a)留装订边;(b)不留装订边 2.图纸幅面尺 ...

  2. f分布表完整图a=0.01_使用 Infer.NET 评价竞争对手

    Infer.NET 是开放源代码的代码库,可用于创建概率性编程系统.我往往会将普通的计算机程序视作,主要基于有指定类型的值的变量(如有值"Q"的 char 变量).概率性编程主要基 ...

  3. f分布表完整图a=0.01_自动控制原理2.2.2传递函数零极点,零点如何影响输出响应曲线...

    2.传递函数零点和极点 传递函数分子多项式和分母多项式经因式分解后可写为如下形式: Zi是分子多项式零点,称为传递函数零点,Pj是分母多项式零点,称为传递函数极点.系数K*=b0/a0称为传递函数系数 ...

  4. f分布表完整图a=0.05_MySQL8.0新特性-invisible indexes

    作者 李春·沃趣科技首席架构师 出品 沃趣科技 作者简介: 曾就职于阿里巴巴,全程参与阿里数据架构从Oracle迁移到MySQL过程,参与分布式中间件Cobar设计. | 导语 MySQL 8.0版本 ...

  5. f分布表完整图a=0.05_2019年05月16日,沪深A股股票分析

    纽约华尔街,伦敦金融城,Tier 1投行,我们希望撕掉标签,用数据说话. 欢迎您留言和赞赏,谢谢.一.整体分析 我们选取了沪深A股的股票,利用历史数据对超过60种交易策略进行了预测回测. 下表中列出了 ...

  6. f分布表完整图a=0.01_SQL Server从入门到精通——学习笔记01(数据库基础知识篇)...

    1.1 数据库的概念 数据库(DataBase,DB):是存放数据的仓库,只不过这些数据存在一定的关联,并按一定的格式存放在计算机上. 1.2 数据库管理系统 数据库管理系统(DataBase Man ...

  7. f分布表完整图_【教育统计答疑】如何理解正态分布、均值分布、^2分布、t分布和F分布...

    许多教育统计的初学者都表示这几个分布感到学起来非常吃力,结合最近上课的体会以及答疑的情况,觉得很有必要在这里简单地对这部分内容进行澄清和梳理,以助理解. 首先,"为什么要学习这几个分布&qu ...

  8. f分布表完整图_分布式计算引擎之星——Spark

    点击上方"数风云"关注我们吧 文/李萌 Spark作为分布式计算引擎的一颗璀璨之星,继承了MapReduce分布式并行计算的优点,并改进了MapReduce明显的缺陷.它使用一种面 ...

  9. f分布表完整图_标准正态分布函数数值表怎么查?(加完整分布函数表)

    最近在整理数据时,忽然想到数理统计的其中一种分布,相信作为质量人一定不陌生,我们常常提到数据的分布是否服从正态分布,这是对一组连续数据分布一种描述,还会涉及到如何检验正态分布,对于这个分布的来龙去脉和 ...

  10. 统计学三大分布(卡方、t、F)即相应概率密度图的R语言实现

    三大统计分布 1. χ2\chi^2χ2分布 ​ 设随机变量X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​相互独立且均服从标准正态分布N(0,1)N(0,1)N(0 ...

最新文章

  1. 长知识啦!字符也可以作为下标!_只愿与一人十指紧扣_新浪博客
  2. linux使用线程实现生产者消费者问题,Linux平台下线程同步,实现“生产者消费者问题”...
  3. 单例设计模式singleton
  4. dataframe的multiIndex在次级index上做筛选
  5. Kubernetes安装之五:配置kubectl客户端
  6. C++ 类模板中友元函数问题
  7. .NET/C#程序开发中如何更优美地实现失败任务重试的逻辑?
  8. Linux内核入门之路 (非广告)
  9. js控制input只能输入数字和小数点后两位,输入其他自动清除方法。
  10. 深度学习入门实例——基于keras的mnist手写数字识别
  11. python申明变量和赋值_Python入门(二)
  12. C语言课程设计学生考勤管理系统
  13. SqlServer2008 不允许保存更改
  14. “熊猫烧香”制造者的起伏人生
  15. oracle rfs进程过多,DATA GUARD的RFS进程的问题
  16. C#动态创建lambda表达式
  17. 神经网络中BP算法的推导
  18. github上传自己的代码
  19. 实习笔记—— AOP开发II(AOP中Advice的类型)
  20. sql注入-简要SQL注入

热门文章

  1. 软件实施工程师到底是干什么的?全方位介绍实施工程师的职责要求和发展前景
  2. 8. Andrénalin ★ Serial
  3. 基于格密码的算法研究
  4. python吃鸡透视_绝地求生仅需这个设置!让你的电脑自带透视!吃鸡到手软
  5. 100个Python实战项目(一)使用 Python 生成二维码
  6. mysql与oracle语法区别
  7. HiJson 百度网盘下载
  8. linux arm sbus,嵌入式ARM系列linux2.4配置makefile完全注释(2)
  9. 中国大学MOOC(慕课)离线下载视频支持电脑播放
  10. CAPL-如何调用外部的可执行程序