昨天勾妹给大家分享了数据可视化分析的建设目标,今天聊聊如何去实现这个目标——方法体系及操作流程

数据可视化分析方法论结构图

方法体系

数据可视化分析方法体系图

数据可视化分析的常用工作方法包括专家法、参照法、归纳法和混合法 4 种。

专家法是一种自上而下、整体规划的方法,适合具有行业领域专家的情况。在这种情况下,依赖行业领域专家的经验,我们可以构建起体系化的数据可视化分析体系。

参照法是一种通过参照和对标行业标准,适配自身业务,构建数据可视化分析体系的方法。该方法适合自身没有行业领域专家,但是有行业内最佳实践或者标准规范的团队。

归纳法也是一种自下而上的工作方法,通过归纳和总结自身业务特点,不断抽象和提炼公共模型,逐步建设数据可视化分析体系的过程。该方法适用于既无行业专家,也没有经验丰富的团队的情况,是诸多方法中投入成本最高的,但很多时候,却不得不采取的一种方法。

混合法是数据可视化分析体系建设到一定阶段之后的必然选择。一方面通过归纳法实践,有了可供参考的模式,形成了可供参照的规范;另外一方面,团队成员在实践中逐步了解业务、了解技术、了解数据,从而成为该细分领域的专家。

无论选择哪种工作方法,数据可视化分析的基本原则是不变的,即围绕业务进行分析,服务于业务、解决业务问题,是该工作必须坚持的核心原则。

明确了数据可视化分析的目的,我们就要开始工作了。

操作流程

数据可视化分析的操作流程并没有一个行业标准和规范,不过基于实践经验的总结,同时参考跨领域的行业标准和规范 CRISP-DIM,我们设计出了数据可视化分析的操作流程,共分为 7 个步骤,如下图所示:

数据可视化分析操作流程图

1.业务理解

一个不了解业务的人,无法参与到数据可视化分析的工作中来;拒绝了解业务的人,没有权力参与数据可视化分析的工作。

在业务理解上,你需要做到:

系统地掌握业务流程,包括业务流、数据流和资金流等;

深刻理解业务规则,是解读业务的前提;

识别业务活动,是输出业务指标和分析维度的关键;

2.定义指标

指标是说明总体综合数量特征的概念,一个完整的指标一般由指标名称和指标数值两部分组成,它体现了事物质的规定性、量的规定性两个方面的特点。定义指标的过程是基于业务活动、抽取和提炼可度量因子的过程。

完整的指标定义过程包括:

业务口径,指标的业务逻辑,比如订单已定量 = 订单净已定量 + 订单已退量, 这一过程赋予了业务指标业务含义;

计算逻辑,业务指标的技术口径,对应完整的 SQL 查询语句和对应的聚合逻辑;

审批流程,确保指标全局唯一性的保障机制,通过审核机制一方面可以确保指标的逻辑正确,另外一方面可以避免指标的重复建设;

权限控制,对于指标使用范围的限定和约束,可以有效约束核心指标数据的使用边界,是保障数据安全的一种手段。

完成指标定义的范例如下图所示:

指标定义图

3.定义维度

维度是分析问题和查看指标的不同视角,指标和维度共同构成数据可视化分析的内容框架。

常见的分析维度包括对比维度、分布维度、构成维度和关系维度等,一个完整的关于维度和常用图表的关系如下图所示:

常见维度图

4.设计呈现

设计呈现是基于已定义的指标和维度,设计页面布局、选择可视图表、设计主题样式和数据交互模式,进行数据可视化呈现的过程。

该步骤的核心在于可视化图表的选择,常见的可视化图表包括:折线图、柱状图、散点图等,每个图表适用的场景不同,我会在后面课时中具体讲解。常见图表呈现效果如下图所示:

Echarts 可视化图表

5.程序设计

程序设计的过程是数据可视化分析工作从设计到研发的转换阶段,需要完成数据理解、数据准备、图表设计和数据验证工作。

伴随数据可视化分析平台技术的发展,越来越多的无代码开发平台的功能越来越完善,如 Redash、Metabase、Supperset 等。

这使得没有代码开发基础和开发资源的团队,在该环节,有了新的选择。他们可以选择可视化数据分析平台,进行无代码开发、程序设计的工作,可以替换为图表设计的工作。

可视化分析平台 Redash 的操作界面如下图所示:

数据可视化分析平台图

6.数据发布

数据发布的目的是把程序设计阶段的输出结果,通过工具化和线上化的手段进行共享。

上述 5 个步骤,都是服务于第 6 个步骤的。数据发布面向不同的用户群体,发布不同的数据内容,包括个人客户、部门客户、业务线客户和集团客户。数据发布的最终输出形式,往往以 Web 站点的方式对外进行,包括数据看板、仪表盘和数据大屏等。

典型的数据发布案例如下图所示:

数据发布图

7.分析洞察

前面 6 个步骤,完成的是数据呈现业务的问题。该步骤是建立在数据发布基础之上的,基于构建的数据可视化图表,进行问题发现、问题分析和定位原因的过程。

虽然分析洞察是数据可视化分析工作的最后一个环节,但不是数据分析工作的最后一个步骤,得出的结论,需要应用到运营策略、营销策略中去,才能够产生最后的价值。

以某单一产品的销售情况为例。

某一个时间节点,总销量下降,我们可以在商品销量趋势图中看到明显的转折点,通过商品销量的构成维度、地区分布维度及对比维度,可以发现该商品销量下降的情况是:某个时间节点,某个地区的销量下降导致的总销量异常,发现问题发生的地方。尔后,调整产品运营、营销策略验证具体原因,从而解决相关问题。

camunda流程定义表无数据_【经验】数据可视化分析操作指南相关推荐

  1. camunda流程定义表无数据_[Python04] 学习snakemake,三步轻松搭建生信流程!

    随着学习的不断深入,分析的数据越来越多.你会发现,日常生信分析不过是调用一些相同的函数或者包分析不同的数据,换汤不换药. 那么,如何把分析过程流程化,让数据像工厂的流水线一样自动被处理? 最简单的法子 ...

  2. camunda流程定义表无数据_创建流程实例时 act_ru_identitylink 表中没有出现相关的人员数据...

    老师您好,我对流程实例有两个问题: 创建流程实例的方法,视频中给出的是 ProcessInstance processInstance = runtimeService.startProcessIns ...

  3. camunda流程定义表无数据_BPM - 业务流程管理

    1.BPM定义 BPM起源于,20世纪90年代,Michael Hammer和James Champy的成名之作<公司再造>,当时在全美公司领域引发了一股有关业务流程改进的汹涌浪潮.BPM ...

  4. 数据透视表 字段交叉_删除数据透视表的计算字段的宏

    数据透视表 字段交叉 Have you ever recorded a macro to remove pivot table calculated fields? Just turn on the ...

  5. 数据可视化分析票房数据报告_票房收入分析和可视化

    数据可视化分析票房数据报告 Welcome back to my 100 Days of Data Science Challenge Journey. On day 4 and 5, I work ...

  6. 大数据可视化陈为智慧树_知到智慧树_大数据可视化_大学课后答案

    知到智慧树_大数据可视化_大学课后答案 更多相关问题 用下列方法不能将NaCl和Na2CO3两种溶液区分开的是()A.向两种溶液中分别滴加醋酸B.向两种溶液中分别滴加稀硫 为了除去KCl中少量的MgS ...

  7. 数据图表与分析图_史上最全最实用的数据可视化分析图表制作工具汇总

    俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据 ...

  8. nbi可视化_用数据可视化的方式做汇报,更容易显现成绩、升职加薪更近一步

    在日常工作中,老板总是会时不时的让我们做工作汇报,而这也是我们能够在老板面前展示自己的机会.但是,如果你拿给老板的是这样一张数据密密麻麻的表格,你觉得老板能够在短时间内看懂你的数据吗? 字不如表,表不 ...

  9. 大数据可视化陈为智慧树_智慧树知到_大数据可视化_答案章节单元测试答案

    智慧树知到_大数据可视化_答案章节单元测试答案 更多相关问题 (1)33+(-23)2-48-12×6:(2)当a=2时,计算21-a-a1+a的值. 计算(1-11-a)(1a2-1)的结果正确的是 ...

最新文章

  1. 机房收费系统(VB.NET)——超具体的报表制作过程
  2. win10安装spacemacs
  3. thinkphp5 404 file_put_contents 无法打开流:权限被拒绝
  4. php远程文件包含攻击,PHP “is_a()”函数远程文件包含漏洞
  5. 构建适用于Oracle 11.2.0.x的Linux单数据库实例的DataGuard
  6. opensource项目_最佳Opensource.com:开放的组织文化
  7. 【Unity开源项目精选】AssetStudio:提取Unity游戏的资源
  8. 解决有效时间的字段的知识查询
  9. 使用程序简单查询IP地址
  10. matlab迭代算法实例_【优化求解】基于NSGA2的求解多目标柔性车间调度算法
  11. 遗传算法实践详解(deap框架初体验)
  12. MulterError: Unexpected field
  13. PDMS二次开发(十二)——螺栓材料统计功能一批bug修复之后再次用sample项目进行验证
  14. 安全漏洞防御(8) DDOS 攻击的防范教程
  15. 引用百度新闻热门搜索html,百度新闻搜索技巧(之一)
  16. next_day函数用法
  17. 开源SLAM方案评价与比较
  18. 无人驾驶系统技术岗位分析(感知算法)
  19. 2021天梯赛L1-079 天梯赛的善良 题解
  20. [Python]网络爬虫(六) 一个刷投票小脚本

热门文章

  1. 不用掉一根头发!用 Flutter + Dart 快速构建一款绝美移动 App
  2. 5G 是否有过度承诺之嫌?
  3. 网易发“暴力裁员”内部说明;京东负责不幸员工的孩子费用到22岁;Linux kernel 5.4发布 | 极客头条...
  4. 8 月社群专属福利活动开启!进群免费领取开发视频课程!
  5. 如何避免程序员的大脑超载?
  6. 为什么说:“你不合适学Python?”醍醐灌顶!
  7. 华为顶尖应届生最高年薪超 200 万;抖音服务器宕机;GitLab 12.1 发布 | 极客头条...
  8. 春运车票为谁“秒空”?第三方软件的困与危
  9. 20 岁 Google vs 18 岁百度,分道扬镳?| 畅言
  10. 滴滴,一个连接者的责任边界