二、用于数据分析的Tableau技巧
以下为自己关于Tableau的学习总结
跟B站up:戴戴戴师兄 https://www.bilibili.com/video/BV1ZM4y1u7uF?p=2
1. 数据连接
(1)本地文件:csv数据连接到文本
(2)选中第一个后直接拖拽,后面选中连接字段即可(字段也可用公式计算或编辑)
(3)为了保证速度一般提取方式选“数据提取”(实时是每次操作都连接一次数据库)
(4)数据筛选:一般针对数据比较大的情况,筛选出需要的行数和字段
(5)这里可以将数据变成字段名,点击某字段名里面的“下三角:描述,加载”
可以看见该字段名里的内容
2. 数据可视化原理
2.1 数据有【维度】和【度量】两种类型
(1)数值型变量【度量】Measures:一般是由数字组成的变量
数值变量可以进行计算,并基于计算结果的大小表示图表的面积大小、条形长短、颜色深浅等可以量化的视觉元素
(2)类别型变量【维度】Dimensions:类别变量包含有限的类别数或可区分组数(数值变量过多时需要分组
类别变量主要用来对数值变量的计算结果进行区分,表现为图表的颜色种类、图形位置、分类方式等难以量化的视觉元素,只能进行计数和分布等简单计算
2.2 tableau可视化原理
1)度量值会形成图形标记,图形标记可以切换
2)维度会对度量值进行区分,增加度量值的信息密度(单个图表传达信息的多少)
3)图表分为有轴图表和无轴图表(极坐标图表)
4)离散形成标签,连续形成数轴:
5)表格就是由离散的维度标签所组成
2.3 总结:
(1)度量默认聚合
(2)度量值会形成图形标记,图形标记可以切换
(3)维度会对度量值进行区分,增加度量值的信息密度(单个图表传达信息的多少)
(4)图表分为有轴图表和无轴图表(极坐标图表)
(5)离散形成标签,连续形成数轴
3. 图表制作制作
(1)横纵坐标切换(柱状图变条形图):
(2)创建分层结构——实现数据钻取(先创建,后面优先级直接拖取即可)
(3)添加筛选器——实现数据选取
直接拖进筛选器里,之后显示筛选器,下拉有单选、多选等,实现数据选取
3.1 柱状图、条形图(直接拖数据)
3.2 热力图(突出显示表)
先做好大致图形——将要突出显示的内容拖到颜色——将“自动”改为“方形”
3.3 饼状图、词云、气泡图、树地图
(1)饼状图显示数据:
快速表计算,合计百分比(快速表计算中的差异就是同比环比,需要进一步探索)——设置格式(百分比位数)
(2)饼状图改成方形即变成树地图
3.4 堆积图
(1)最简单的堆积图是画好一个后直接将另一个拖到图形中
(2)显示标签和前面一样,按住ctrl然后拖到标签中
(3)百分比相关设置:
对数值(也就是对拖到标签下的对象)
①显示一列中元素分别占整体的百分比:直接快速表计算(默认表横穿),合计百分比
②显示一列中元素占这一列的百分比:编辑表计算,表(向下)
对数轴(也就是对行、列的对象)
①合计百分比默认是“表横穿”
②编辑百分比之后改成“表向下”,纵坐标在同一水平上,显示一列中元素占这一列的百分比(相对百分比)
如果放到一起:下图是一个比较典型的图,上面是具体数据(同时通过高度显示每一列相对整体的占比),下面是相对比值(每一列中的元素占这一列的比)
3.5 折线图(关键是预测和趋势线)
(1)当日期作为列时,注意日期的选择:上面的月如下,表示“一月到十二月”,数据是离散的,不能预测,八月代表两个八月,2019和2020;下面的月表示连续月份,可以用来做预测
(2)预测:分析——预测(拖拽到预测里)——预测不太好的话可以把列(这里是日期)ctrl拖到旁边的筛选器里,重选一下数据范围,或者换一下,把月换成天,数据点更多的话预测会准一点
(3)趋势线(预测上面)
3.6 面积图
直接先画条形图(日期—GMV),再将另一元素拖进颜色块(如:平台),最后改为“区域”
3.7 散点图
横纵轴各代表一个【度量】,【维度】中的变量则作为一个点,根据横纵轴上的度量值大小确认位置(将两个【度量】分别拖拽至行列,再将点代表的【维】度拖拽至详细信息,添加颜色)
散点图比较常见的做法是添加趋势线和群集,对数据进行聚类分析(即分类)
3.8 直方图(针对某个数据的数据分布)
两种方法:
- 拖进需要查看分布的数据到列。然后智能显示——直方图
- 对需要分布计数的数据创建数据桶,拖到列,再将字段名最下面的“计数”拖到行上即可
右键数据桶,编辑,数据桶大小(也就是数据间隔,越小越细)
3.9 地图
1.显示整个城市:找到城市,右击“地理角色”,省市自治区,城市前面变成有地图小标的字段,双击,即显示地图位置,在智能推荐里可以选择地图的两种颜色区分
2. 以地理位置为点,用点大小、颜色展示度量值大小等特征
(1)先设置数据类型为【地理角色】
城市要设置为城市
省要设置为州/省/市/自治区
经纬度要分别设置好,然后双击字段,将经纬度对应的维度拖到详细信息上
(2)在经纬度基础上添加维度(和上面一样,只有横纵坐标没有添加数据区分)
4. 可视化原则
(1)区分用户
(2)主次分明、详略得当
强调信息的方式有很多种,用恰当的方式去强调恰当的内容(位置、颜色、大小、形状)
(3)真实准确
刻度要从0开始,特别是一些柱状图,不从0开始会极大地影响数据对比
(4)符合大众认知和审美习惯
地理位置用地图、随时间变化用折线图都是基本认知
(5)适度原则
颜色一般不要超过8种,不能过分强调,且搭配要合理
排版、字体、大小、形状等都要合适
避免使用3d效果,容易产生错觉
(6)五秒原则
(7)恰到好处的说明
很多时候都需要对图标做出恰当的说明,帮助人们更加直接地理解信息
说明包括:标题、图例、标注、结论等【通过右键数据添加注释】
颜色代表什么要有图例说明
(8)少即是多
超过8种颜色几乎等于没有用颜色区分
5. BI仪表盘搭建
5.1 明确仪表盘主题
5.1.1 你的观众是谁?他们对什么感兴趣?
5.1.2 数据可以发挥的主题往往有很多
5.2 仪表盘主题拆解
5.2.1 怎样的数据能表达清楚你想说的主题?
(1)这个主题涉及到哪些数据?
(2)数据的重要程度是否相同?
(3)最适合数据的图表是哪种?
对比:绝对值对比——条形图/柱状图
变化:
没有累计关系——折线图+柱状图
有累计关系——面积图/堆积图
构成:
对象少于3个——环形图
对象大于3个——树地图
分布:
单变量分布——直方图
多变量分布——散点图、气泡图
5.3 一些细节
1.每次将日期拖拽再从年修改到天比较麻烦,可以直接自定义日期创建一个天,这里的日期部分对应于离散的日期
2.做同一坐标轴多图线时,直接拖拽到纵轴会变成多坐标轴,可以将数据拖到图形的纵坐标上,就会共用坐标轴了
3.百分比和数据公用一个坐标轴时百分比太小,所以先将百分比调成数字格式—百分比,之后两个图做好以后右键,双轴。可以通过大小和颜色调节,同时行列上面的前后也可以调节图形显示的前后顺序
4.环形图
(1)环形图先做成饼图,之后双击行,输入0,再双击行,再输入0,得到两个图
右击,双轴
这时左边工具栏就有了两个总图,将下面一个里面内容全部删除,颜色改为白色
调整两个图的大小
右键删去坐标轴和设置格式(将零值线设为无)
(2)编辑别名:右击右上角小图标,编辑别名,或者直接在左边字段名那里,右键,别名
(3)分组:右键需要分组的字段,组(数据桶是等阶的,组可以自由选择分段的间隔
5.一般配色分暖色系或深色系,和公司图标颜色接近比较好
6. BI仪表盘展示
二、用于数据分析的Tableau技巧相关推荐
- 数据分析学习笔记(二) 数据分析的思维技巧
秦路<七周成为数据分析师>学习笔记,供自己学习查看使用,侵删. 目录 象限法 多维法 假设法 指数法 二八法 对比法 漏斗法 象限法 常见用途: 用户分群:用户价值与用户流失度两个维度进行 ...
- 数据分析学习笔记(二)数据分析三思维七技巧
数据分析学习笔记(二) What 三种核心思维 结构化 公式化 业务化 Why 数据分析的思维技巧 象限法 多维法 假设法 指数法 二八法 对比法 漏斗法 总结 How 如何在业余时间锻炼分析能力 好 ...
- tableau linux无网络安装_举个栗子!Tableau 技巧(110)两种方法实现正态分布 Normal distribution...
关于正态分布 正态分布(Normal distribution),也称"常态分布",又名高斯分布(Gaussian distribution).正态分布是统计学中一个重要的概率分布 ...
- tableau三轴合并_举个栗子!Tableau技巧(34):同一张图表如何呈现多个度量
Tableau用户:怎样把条形状和折线图放在同一个图表里? 阿达:你想在同一个工作表里放入两个维度吗? Tableau用户:是的,有这样的栗子吗? 的确,在我们的日常数据分析工作中,常常需要对多个指标 ...
- 举个栗子!Tableau 技巧(165):快速计算工作日
来自银行用户的需求:我们的业务数据源表多.量大(超过 10 万行),并且常常需要分析工作日数据.这种情况,Tableau 能快速实现吗? 其实,在实际分析场景中,对于工作日的数据呈现,是普遍需求.尤其 ...
- python用于数据分析的书籍_做数据分析不得不看的书有哪些?
书不在多,而在于精.我分析了知乎上推荐的数据分析类书籍的回答,最终总结了以下内容,形成了这篇文章. 数据分析类的书有很多,可以按数据分析的流程分类,每个流程应该看哪些书籍. 也可以按照通识类和工具类进 ...
- 日周月筛选器_举个栗子!Tableau 技巧(147):使用 动态参数 筛选到最新日期值...
之前,我们分享过如何在筛选日期时,始终自动筛选到最新日期值的方法:筛选到最新日期值. 现在,Tableau 2020.1 版本 用户也可以使用新增的动态参数功能,实现同样的呈现效果. 那么,如何利用 ...
- scala 判断字段 是不是 日期类型_举个栗子!Tableau 技巧(147):使用 动态参数 筛选到最新日期值...
之前,我们分享过如何在筛选日期时,始终自动筛选到最新日期值的方法:筛选到最新日期值. 现在,Tableau 2020.1 版本 用户也可以使用新增的动态参数功能,实现同样的呈现效果. 那么,如何利用 ...
- tableau选择计算_举个栗子!Tableau 技巧(100):吸睛又直观的 四瓣花图 怎么实现?...
☻ 时间过的真快,<举个栗子!Tableau 技巧>系列已经推送至第 100 篇.希望这 100 个栗子可以帮助数据粉,真真切切学会使用 Tableau ♥ ➤ 栗子 NO.100,我们来 ...
- 10个Python进行数据分析的小技巧
Pandas中数据框数据的Profiling过程 Profiling(分析器)是一个帮助我们理解数据的过程,而Pandas Profiling是一个Python包,它可以简单快速地对Pandas 的数 ...
最新文章
- qvector 结构体排序_C++结构体的应用_YCOJ
- oracle方差和协方差函数,[转载]方差var、协方差cov、协方差矩阵(浅谈)(三)_函数cov...
- 关于opencv中Mat赋值(浅拷贝,深拷贝)原理
- 前端学习(3149):react-hello-react之总结生命周期
- centos radius mysql_centos6.5下安装freeradius2.2.9+mysql
- python编写下载器可暂停_Python编写一个优美的下载器
- 基于RNGCryptoServiceProvider的洗牌算法
- 【BZOJ4561】[JLoi2016]圆的异或并
- 中兴服务器管理口配置,中兴交换机简明配置教程
- Maven学习—Nexus3私服搭建
- Spring Data JPA实战视频教程
- 基于C#和遥感软件二次开发的宜居度综合方法
- 2022年PYTHON应用行业,PYTHON就业方向
- 企业网站内容维护日常工作有哪些
- Wiki使用技巧汇总
- Spring AOP(面向切面) 注解使用方法
- java端口扫描器_简单端口扫描器java的设计与实现.doc
- 【项目实战-MATLAB】:基于MATLAB的车牌识别系统(GUI界面+库外识别+计时计费+语音播报)
- 关于部分手机使用听筒模式播放音频时没有声音的问题
- Multi-Tenancy模式,基础服务大规模扩张的时候,是应该推进了。