使用Tableau做数据分析的一些思考
文章目录
- 使用Tableau做数据分析的一些思考
- 问题分析
- Tableau使用技巧
使用Tableau做数据分析的一些思考
参考:
Tableau数据分析训练营之LOD专题
15 大详细级别表达式
对于Tableau数据分析有两句话非常重要:
- 分析即聚合。
- 维度是聚合依据。
问题分析
需要理解复杂问题的层级关系,通常与当前层级有:向上/向下,两种关系
- 向下的层级问题,需要用
fixed
固定层级关系,也可以使用INCLUDE
- 向上的层级问题,有三种方法:
- 表计算:window_sum/total
建议使用,因为表计算是计算展示出来的数据,计算速度比较快 - fixed:直接指定需要计算的层级
- exclude:排除当前视图的层级,排除之后就根据更高级一级的维度聚合。
exclude:是按照排除指定层级之后,最小层级聚合的,比如说有三个层级,A、B、C,将B层级排除之后,将按照C层级进行聚合。
- 表计算:window_sum/total
例如:
- 简单的问题是可以直接从明细表中将维度提取出来,比如说每个国家的销量,每个国家就可以直接从明细表中
group by
出来。 - 复杂问题是引用了其他聚合的结果作为维度。比如说销售量
1、2...N
的客户数,这里的1、2...N
,无法直接从明细表中提取出来,需要先进行聚合,将聚合的结果作为维度(一般使用Fixed),再一步的聚合。
那么遇到复杂问题该怎么办呢?
首先应该做的是问题分析。将问题拆解为三个内容:
- 问题范围
- 问题描述(维度)
- 问题答案(度量)
例如问题:
有多少客户购买了1次、2次、3次…N次订单?
现在看一下这个问题的描述,思考三个问题,问题的范围是什么?问题描述是什么?问题的答案又是什么?
问题范围:可以看到,该问题没有设定范围,也就是所有数据。
问题描述(维度):它需要的是,购买了1次、2次、3次....N次订单
的XXX,所以它的维度是不同频次
。
问题答案(度量):它最后需要什么,多少客户
,因此客户数量
就是它的结果。
综上,将问题转换为标准问题结果:(no filter),不同购买频次的客户数量?
将问题转换为标准问题之后,就根据维度,度量,范围,做一定的数据分析。
遇到问题最主要的是能够分解问题,主要是对于问题维度的思考,适合这个问题的维度。
Tableau使用技巧
- 对于表的计算,
window_sum
,在使用目前视图中已经有的数据很有效。比如使用IIF
判断得到的数据,若想要都进行赋值,可以使用window_sum
,来计算。 - 对于赋予想要筛选的值/不确定的值,可以将这个字段转换为参数,之后在公式中使用这个参数,就可以根据这个参数进行筛选了。
- 在tableau中,交互条件也可以进行设置,设置交互条件之后,点击某个值,可以修改参数的值。
- 对于sum和相减,建议先sum再相减,若先相减再sum,性能会较差
SUM(IIF({INCLUDE [Product]:SUM([Profit])-SUM([Target Profit])}>0,1,0))
可以判断LOD的结果,它与SUM({INCLUDE [Product]:IIF(SUM([Profit])-SUM([Target Profit])>0,1,0)})
结果相同
先从熟悉的层次开始,从交叉表开始,最后转换为图形。
对于综合问题的层次、筛选的影响,合理的选择计算。
FIXED
是绝对的引用,不收视图的影响INCLUDE
是相对的引用,通常用于更低层次的聚合。INCLUDE
为空,相当于当前视图完成聚合,并可以根据当前视图的变换而变化。同理,EXCLUED
为空,也是基于当前视图完场聚合。
表计算是聚合的聚合,而LOD是在指定层级的聚合。
表计算,可以进行辅助计算,设定辅助计算的维度,以及计算的方法。
在实际业务中,关于周的数据需要多一点考虑,例如日期虽然同步了,但是每周的数量不一致。这是在实际业务中需要注意的地方。
将筛选器添加到上下文,会将筛选的优先级提高到最高,例如字段中有fixed,默认筛选器在fixed优先级之后,所以筛选之后不会影响fixed的计算结果。将筛选器添加到上下文之后,筛选器的优先级会高于fixed,筛选之后的结果会影响fixed的计算结果。有一种特殊情况,当筛选器的对象和fixed定义的层级是一一对应的,这时是否将筛选器添加到上下文,对fixed的计算都没有影响了。
tableau中集合的运用是,可以理解成多个参数,在一个仪表盘中,可以创建一个操作,用来更新集合的值。
- 默认的窗口函数的累加是从头开始累加的。
WINDOW_SUM(COUNTD([Customer ID]),0,LAST())
,注意后面两个参数,可以实现从后往前加,利用的类似与sql中的窗口函数,将末尾固定,每次累计当前行到最后一行。
使用Tableau做数据分析的一些思考相关推荐
- python爬虫tableau数据分析_完美!Python爬招聘数据,Tableau做可视化分析
原标题:完美!Python爬招聘数据,Tableau做可视化分析 交流群预热好久的可视化交互大屏来啦 1.项目背景 随着科技的飞速发展,数据呈现爆发式的增长,任何人都摆脱不了与数据打交道,社会对于&q ...
- 干货 :手把手教你Tableau高级数据分析功能(附数据集)
原文标题:A Step-by-Step Guide to learn Advanced Tableau – for Data Science and Business Intelligence Pro ...
- 做数据分析不得不看的书有哪些?(文末抽奖送书)
书不在多,而在于精. (文末抽奖送书哟) 数据分析类的书有很多,可以按数据分析的流程分类,每个流程应该看哪些书籍. 也可以按照通识类和工具类进行分类,通识类可以理解为入门读物类,工具类就是针对不同的工 ...
- python用于数据分析的书籍_做数据分析不得不看的书有哪些?
书不在多,而在于精.我分析了知乎上推荐的数据分析类书籍的回答,最终总结了以下内容,形成了这篇文章. 数据分析类的书有很多,可以按数据分析的流程分类,每个流程应该看哪些书籍. 也可以按照通识类和工具类进 ...
- 创业公司如何做数据分析(一)开篇
在过去的一年里,笔者加入了一家移动互联网创业公司,工作之一便是负责数据业务的建设,陆陆续续完成了一些数据系统的实现,来满足公司的数据需求.在创业公司中做数据相关的事情,而且是从零做起,肯定不像很多大公 ...
- 一个为制造业而生的AI助手,普通员工向它提问就能做数据分析
赖可 发自 凹非寺 量子位 报道 | 公众号 QbitAI 制造业正面临着新境遇. 产业链.供应链周期变短,不确定因素增加.数字化转型呼之欲出,AI落地的需求越来越明显. 怎样让AI技术切实创造效益呢 ...
- 这6种性格的人不适合做数据分析
想必大家都清楚,数据分析是一个入门简单,深入难得行业,随着现在技术.工具的发展,很多人拿到数据后,直接输入到特定的环境下就可以快速得到想要的数据,比如一组订单数据,放进excel透视一下就可以知道什么 ...
- 最不适合做数据分析的6种性格,看看你占了几个?
我接触很多人3年甚至多年的时间都仅仅停留在入门,但他们自我感觉是资深,仔细想一想以下六类人可能不适合做数据分析. 1.不善于思考的 其实数据分析的精髓在于思考,无论是出报表.还是做报告,其实都是希望通 ...
- 创业公司做数据分析(一)开篇
了解"认知心理学"的朋友应该知道:人类对事物的认知,总是由浅入深.然而,每个人思考的深度千差万别,关键在于思考的方式.通过提问三部曲:WHAT->HOW->WHY,可以 ...
最新文章
- Xshell+技巧+快捷键
- 前端httpd+keepalived加后端heartbeat+nfs+drbd实现httpd服务的高效应用及资源统一管理...
- 为高考学子加油,Java快速开发平台,JEECG 3.7.6高考性能增强版本发布
- 建立一个普通方法无法打开查看和删除的文件夹
- php采到的数据自动修改入库,基于PHP的简单采集数据入库程序【续篇】_php实例...
- 批处理只执行第一句,其他的不被执行,怎么办?
- php format tool,usb 開機碟製作工具HP USB Disk Storage format Tool 2.23
- 工业控制系统(ICS)
- FPGA工程师面试试题集锦41~50
- 微信小程序上传图片后 开发者工具自动刷新问题
- 易点易动【设备管理】产品全新上线
- 优化爬山法之八皇后问题
- Java-装箱和拆箱(谁动了我的变量?)
- [开发]resin+spring+struts配搭在线上常见的三个问题
- 数据仓库工程师历年企业笔试真题汇总
- 【BW系列】SAP 讲讲BW/4 HANA和BW on HANA的区别
- 中学-综合素质【8】
- Rtools 环境变量设置-windows
- 如何使用wpa_supplicant及wpa_cli 创建p2p
- Unix/Linux编程:解析路径名------realpath()