1.数据分层(层级)结构

1.1分层结构的概念与意义

分层结构是维度之间自上而下的组织形式。

Tableau默认包含对某些字段的分层结构,比如日期、时间、地理角色。

以日期为例,包含年、季度、月、日等数据分层结构。

打开“全球超市订单数据.xlsx”。

将两个工作表数据拖到右侧。联结为内部联结。

将【利润】拖到【行】,将【订单日期】拖到【列】,点击【年(订购日期)】右侧的+,会往下分层(称之为下钻),并变成-,点击-,会把层折叠(称为上钻)。

1.2分层结构的创建与使用案例

打开“人工坐席接听数据.xlsx”。

中心和人工服务接听量柱形图

新建工作表2,右击【中心】——【分层结构】——【创建分层结构】。

命名为【层级】。

【维度】下变化如下

将字段【部】、【组】、【班】,拖到【中心】下面,注意顺序,上下顺序就是层级顺序。

将【中心】放到【列】中,将【人工服务接听量】放到【行】中,将【人工服务接听量】放到【标签】上。

点击【整个视图】。

右击【总和(人工服务接听量)】——【设置格式】,点击【数字】

【数字(自定义)】,设置小数位数为0,【显示单位】为千。

点击【列】里的【中心】左边的+,逐级下钻,进行分析,发现有【未知】字段数据太高,属于异常,排除掉。

点击【未知】的柱形,点击【排除】。

分析发现有两个班的数据比较高。

中心、日期和平均呼入通话时长折线图

新建工作表3,将【日期】拖入【列】,选择格式为【天】。

将【中心】拖入【行】,将【平均呼入通话时长】拖入行。

点击【中心】左边的+,下钻到【部】,并继续下钻,可以到【组】,到【班】。

不想用层级的话,右击【移除分层结构】。

第二种创建分层结构方式

将字段【部】拖到字段【中心】上,自动打开【创建分层结构】,命名为【层级】。如果字段上下顺序不对,则拖动调整。

右击【组】——【分层结构】——【添加到分层结构】,选择【层级】,则自动排到【层级】的最下面。

不想【组】在层级里,就直接把【组】往外拖。

注意,层级不能嵌套,但可以并列。

比如新建【层级2】,【层级2】不能放到【层级】里面。

2.数据分组

2.1数据组创建及使用

组是维度成员或度量的离散值的组合。

通过分组,可以实现维度成员的重新组合,以及度量值按范围的分类。

字段图标是回形针图标。

在Tableau里,归类重组维度成员有很多种方式,分组是其中最常见和最快速方式。

注意,组不能创建计算字段,不能出现在公式中。

新建工作表4。

将【班】拖到行中,将【人工服务接听量】放到列中。点击【交换行和列】。

发现13班和13班(15批新人)属于一个班。其他也有可以合到一个组的情况。

创建分组

创建分组有两种方式:

一是右击【班】——【创建】——【组】。

二是在图形里右击【组】(注意,要点击图形,而不是字段)。这里使用第二种方法。

出现【创建组】的对话框,点击【应用】和【确定】。

编辑组

右击带有回形针图标的【班(组)】——【编辑组】。

将【13班(15批新人)】拖到组【13班】下,如果组名不合适,可以右击组名——【重命名】。

按ctrl键,选择【15班】和【15期新人】,点击【分组】,则新建一组。

查找和分组

如果字段名称太多,点击【查找】,查找方式有三种

  • 包含,属于模糊查找,包含这个字就能找到
  • 开头为,则字段开头必须为这个字
  • 精确匹配,则查找字为全部字段。

【范围】是查找范围,指的是全部查询还是在某个组内查询,一般选全部。

想找到所有常白班,【查找成员】输入【白】,【包含】,【范围】选【全部】。点击【查找全部】。

找到后,默认结果是被选中的,点击【分组】,重命名为【常白班】。

同样,对【运行班】分组。

将一些字段分组,称为【其他班】。

修改图表

将【班】拖走,将【班分组】拖到【列】中。点击【交互行和列】。

右击【班分组】,去掉勾选【包含“其他”】

点击【降序】,点击【交互行和列】。

2.2电量销售数据按地理区域分组

打开文件“2014年各省市售电量.xlsx”

中国一般分为七个区:东北,华东,华中,华北,华南,西南和西北。

将省市按照七个区域分组。

建立地图

新建工作表,右击【维度】下【省市】——【地理角色】——【省/市/自治区】。

双击【省市】,点击【未知】,选择【编辑位置】。(注意,因为第七章中自定义地理编码,如果不移除会导致未知过多,点击【地图】——【地理编码】——【移除自定义地理编码】)

修改匹配位置,点击【确定】。

套索选择和建组

将【省市】拖到【标签】上。

点击地图上的【套索选择】按钮,先框选黑龙江,吉林和辽宁三省。

套索选择后,其他省份变灰,只显示选中的省份。

悬浮在【龙江】上,可以看见3省已选择,点击回形针标识,创建东北组。

同样使用套索,选择山东,江苏,安徽,上海,浙江,江西,福建。选择后悬浮在其中一个省份上,点击回形针标识,创建分组华东组。

华北组包括内蒙古,河北,山西,北京,天津。

华中组包括河南,湖北,湖南。

西南组包括重庆、四川和西藏。

西北组包括新疆、青海、甘肃和宁夏。

右击【省市(组)】——【编辑组】,重新命名字段名称和群组名称,点击【确定】。

将【当期值】拖入【大小】。

填充地图

新建工作表6,双击【中国地理区域】,将【同期值】拖到【颜色】,点击【颜色】——【编辑颜色】,选择【红色—蓝色发散】,勾选【倒序】。

将【中国地理区域】和【当期值】拖到【标签】上。

右击标签【总和(当期值)】——【设置格式】,【数字(自定义)】,小数位数为0,显示单位为千(K)。

添加说明,【标记】下空白处右击勾选【说明】,双击说明处,输入文字。

重命名工作表6为“各地区用电量”。【工作表】——【导出】——【图像】。

各区域用电量标靶图

新建工作表7。

将【中国地理区域】和【省市】拖到【行】,将【当期值】拖到列。

将【月度计划值】拖到【详细信息】。

右击坐标轴——【添加参考线】。

选择【分布】下【分区】。

【计算】里选择【百分比】,修改为【50,100】,百分比类型为【总和(月度计划)】。

【标签】选择【无】。

【格式】里【线】选择黑色直线,填充不修改,点击【确定】。

将【中国地理区域】拖到【颜色】,将【当期值】拖到【标签】。

右击标签【总和(当期值)】——【设置格式】。

修改填充颜色:右击坐标轴下方——【编辑参考线】,选择【向下填充】,然后可以选多种填充颜色。

也可以同时选择【对称】和【反向】。【对称】是指颜色沿着参考线对称。

添加说明,【标记】下空白处右击勾选【说明】,双击说明处,输入文字。

重命名工作表7为“电量销售区域标靶图”。【工作表】——【导出】——【图像】。

3.数据集

3.1数据集的相关概念

定义:集是满足某些条件的数据子集,它是维度的部分成员。

图标是

类型

名称 常量集 计算集
类型 静态集 动态集
是否会更新
可用维度度量 单个或多个 单个
创建方式 视图中选择 数据窗口创建

用途

  • 集内外成员的对比分析
  • 集内部成员的对比分析

3.2创建数据集

导入数据“全球超市订单数据.xlsx”

创建静态数据集

新建工作表8,找到负利润的国家数据集。

将【国家/地图】拖到【列】,将【利润】拖到【行】。

点击降序图标。

从数据开始为负数的国家开始往后选。

选择好后,悬浮在上面,选择创建集按钮。

修改集的名称,点击【确定】。

可见左侧【度量】下出现【集】。

将【市场】和【细分市场】拖到【列】中

将【利润】拖到【颜色】上。

修改【利润】的颜色,【渐变颜色】为2阶,勾选【倒序】。这样看的更清楚。

按ctrl键,将图表中蓝色的选出来。选好后右击【创建集】,修改集名称如下,点击【确定】。

右击【集】下【负利润国家2】——【编辑集】,将鼠标悬浮在每条记录的后边,会有×,如果不想要该记录,可以点击移除。

悬浮在列名上,也会有×,如果不想要改列,可以进行删除。

点击【清除工作表】。

将【负利润国家2】拖到【列】中,将【利润】拖到【行】中。可以看到集内外变化。

右击【负利润国家2】——【编辑集】,删除【市场】列,点击【应用】和【确定】。

发现图表无变化,因为【市场】列变化不影响数据。

右击【负利润国家2】——【编辑集】,删除【国家/地区】列,点击【应用】和【确定】。

发现数据发生变化。原因是细分市场里的【公司】和【消费者】变成了内,其他的细分市场变成了外。

创建动态数据集

新建工作表9。

右击【维度】下【产品名称】——【创建】——【集】。

修改集的名称,勾选【按字段】,选择【利润】【总和】【<=】【0】,点击【加载】,点击【确定】。

将【负利润产品】拖到【行】中,将【利润】拖到【列】中。

点击行中【内/外(负利润产品)】的下拉三角,选择【在集内显示成员】。

通过排序方式创建动态数据集

复制工作表9,【清除工作表】,这次找销量在前100的产品。

右击【维度】下【产品名称】——【创建】——【集】。

修改集名称,选择【顶部】,勾选【按字段】,选择【顶部】【100】【数量】【总和】,就是将销量按降序排序,取前100个。点击【确定】。

合并集

合并同一个维度的数据。

右击【负利润产品】——【创建合并集】。

修改集名称,左边是【负利润产品】,右边只能选择【销量TOP100】,因为两者都是从【产品名称】这个维度创建而来。

下面有四种选择:

  • 合并
  • 相交
  • 左交
  • 右交

选择相交,点击【确定】。

通过筛选器创建数据集

将【地区】拖到【筛选器】里,勾选【南亚】【西亚】【中亚】【东亚】【东南亚】,点击【确定】。

右击【筛选器】下的【地区】——【创建集】。

修改集名称,点击【确定】。

数据集用于分层结构

将【集】下【亚洲地区】拖到【维度】——【市场】上,弹出【创建分层结构】,修改分层名称,点击【确定】。


3.3使用集做对比分析

将【卖情怀的产品】拖到【行】,将【利润】拖到【列】。

选择【行】中【卖情怀的产品】的下拉三角——【在集内显示成员】。

点击【显示标记标签】,显示具体标签数值。

Tableau 八、数据分层、数据分组、数据集相关推荐

  1. 什么是数据分层,数据分层的作用!

    大数据环境下该如何优雅地设计数据分层 0x00 前言 最近出现了好几次同样的对话场景: 问:你是做什么的? 答:最近在搞数据仓库. 问:哦,你是传统行业的吧,我是搞大数据的. 答:...... 发个牢 ...

  2. 数据分层/ODS/DW/DM

    数据分层/ODS/DW/DM 数据分层 数据分层的目的 ODS层 (Operational Data Store 又称数据运营层) DW层(data warehouse 数据仓库) DM层 (data ...

  3. 数据库分层数据现实方法

    分层数据 分层数据的每项(除根项)只有一个父项和零个或多个子项的数据集合. 分层数据存在于许多基于数据库的应用程序中,包括论文和邮件列表中的分类.组织层级关系.内容管理系统的分类.产品分类. 邻接表模 ...

  4. Tableau数据分析笔记-Chapter08数据分层、数据分组、数据集

    Tableau数据分析-Chapter08数据分层.数据分组.数据集 数据分层(层级)结构 分层结构的概念与意义 分层结构的创建与使用实例 数据分组 数据组创建及使用 电量销售数据按地理区域分组 数据 ...

  5. tableau数据可视化(数据分层、数据分组、数据集)

    1.数据分层(层级)结构 年-季度-月 创建分层结构,命名为中心 拖动部.组.班如下图 如此可以通过点击加号进行层级下钻 平均呼入通话时长 注:层级不可以嵌套 2.数据分组 组不能用于计算字段的,不能 ...

  6. Tableau学习笔记⑦(数据分层、数据组、数据集)

    一.数据分层(层级)结构 1. 分层结构的概念与意义 分层结构是一种维度之间自上而下的组织形式,Tableau默认包含对某些字段的分层结构,比如日期.日期与时间.地理角色,以日期为例,日期本来就包括年 ...

  7. 数据湖 多维数据集_按汇总分组/多维数据集

    数据湖 多维数据集 时不时地,您会遇到一个使您达到SQL限制的要求. 我们中的许多人可能会早早放弃并使用Java / [或您的语言]计算内容. 相反,使用SQL可能是如此简单快捷. 如果您使用的是高级 ...

  8. 结构方程模型(SEM)高阶应用暨嵌套分层数据及数据分组分析

    说明:变量间非直线关系.变量间交互作用.数据或变量非正态及分类变量分析 结构方程模型(Structural Equation Modeling)是分析多变量间因果关系的利器,在众多学科领域具有巨大应用 ...

  9. tableau desktop(三)--构建数据视图(一)

    本节介绍使用 Tableau 构建数据视图的基本知识. 您将了解如何手动和使用内置工具自动构建视图. 此外,还将了解如何排序.筛选.分组以及分层. 最后,介绍有关日期和时间的使用.参考线和分级以及数据 ...

最新文章

  1. 小米MixPath复现之旅
  2. java 求交集 算法_Java计算交集,差集,并集的方法示例
  3. 这三大“监控系统”是机房重中之重?
  4. 平台积分体系设计方案
  5. fx2n4ad模块中文手册_三菱特殊模块FX2N-4AD-PT详细说明及编程应用
  6. js引擎执行代码的基本流程
  7. deinstall oracle 11g on linux
  8. Flask之Web表单使用
  9. 在手机里输入八卦及64卦符号(老年教程)
  10. dcdc升压计算器excel_两款低压DC-DC升压转换器应用电路
  11. 一步一步教你做微博用户画像分析:Python微博爬虫+词云生成
  12. 1990年图灵奖--费尔南多·考巴脱简介
  13. Linux下编译程序/usr/bin/ld: cannot find -l*错误的解决方法
  14. xp系统显示错误1053服务器,使用故障恢复控制台解决XP系统无法启动的常见故障...
  15. win10如何截屏_Win10隐藏秘技大公开
  16. 系统集成项目管理工程师-法律法规与标准规范
  17. 信管家源代码c语言,AK老唐信管家软件指标 火车轨系统指标源码
  18. Apsara Stack 同行者专刊 | 政企混合云技术架构的演进和发展
  19. NPDP第一章:新产品开发战略
  20. 1. 登陆进入linux系统,查看当前系统的分区信息,centos查看系统信息

热门文章

  1. hadoop集群部署超级详细
  2. 解决Django migrate: Your models in app(s): ‘Mymodelclassname‘ have changes that are not yet reflected
  3. Bounding box regression RCNN我的理解
  4. java实现求最小公倍数_使用Java代码进行因数分解和求最小公倍数的示例
  5. 药剂师揭露中药行业内幕:代煎多偷工减料
  6. win10Oracle繁体乱码,win10系统切换繁简字体出现乱码的解决方法
  7. 如何解决”/”应用程序中的服务器错误
  8. idc机房托管服务器数据相关常见问题解答
  9. 基于 React hooks + Typescript + Cesium 场景暗角效果
  10. win7 u盘 正在计算机,U盘在Win7电脑上读不出来怎么办?两种解决方法全教给你!...