一. 豆瓣电影数量分析

1. 条形图

题目:绘制各国家电影数量条形图(按此命名工作表),要求为横向条形图,按照升序排列,条形图顶部要有标签(要全部显示),选择整个视图将图表充满整个视图区,并给出分析结论。
制图中一些疑点解惑
(1)视图上未显示所有标签。
原因:tableau上隐藏了部分被覆盖的标签。
解决:在“标记”卡上单击“标签”,然后选择“允许标签与其他标记重叠”。
(2)坐标轴标题更改。
解决:复制要更改的字段,然后重命名为需要的名称。

分析
以上是1895年至2016年间各国电影数量对比数据。从上面条形图可以看出
a.美国电影数量遥遥领先,是名副其实的电影大国。
b.排名前五的国家是美国(11979部)、中国(7273部)、日本(5053部),法国(2817部)、英国(2763部)。
c.中国、日本电影产量比法国、英国、韩国等国家都多,其文化产业发达程度可见一斑。

2. 直方图

题目:创建电影评分的直方图(按此命名),数据间距为0.5分,修改底部数字标签,以实际评分区间为底部标签数值,标签要显示完整,并分析电影评分直方图。

(1)直方图的定义
直方图是显示数据分布形状的图表。
(2)数据桶
数据桶就是组距,只能对[度量]数据进行创建数据桶。数据桶是绘制直方图的前提。
创建数据桶后,会按照设定好的组距对当前数据进行分组。
(3)直方图制作步骤
①创建数据桶。选择度量【评分】,右键,创建,【数据桶】
②设置数据桶大小为0.5,确定后生成维度【评分(数据桶)】。
③将维度【评分(数据桶)】拖到列功能区。
④将度量【记录数】拖到行功能区。
⑤将度量【记录数】拖到标记卡的“标签”。

分析:从直方图可以看出,电影评分称明显的正太(右偏峰)分布,多数电影在5.5分到8.5分之间,8.5分以上的电影属于少数高分电影,5.5分以下的电影也属于少数的烂片。

3. 折线图

题目:制作电影数量折线图(以此命名),横轴为时间,排除2016年的数据,显示标签,标记出最大值信息,将标记的线条颜色设为黑色,线末端使用箭头,导出图像,并对折线图进行分析;

需要注意的点
1.源数据中的电影【上映时间】字段包含了“时”、“分”、“秒”数据,需要做<自定义拆分>(此处选择空格作为分隔符)。
2.【上映时间】字段的数据类型时字符串,要更改为日期格式。

分析:电影数量在2008年以前呈现指数形式增长,2008年之后有所下滑,2012年达到顶峰之后又开始下降。

4. 饼图和环形图

题目:绘制 剧情、喜剧、动作 三种类型电影环形图(以此命名),要求空心内部显示三种电影的总记录数(提示:27461),显示电影类型标签及总额百分比,导出图像,不显示说明,选择图例在下;分析环形图数据。


制作步骤:
① 将维度【类型】拖到列功能区,度量【记录数】拖到行功能区。
②将维度【类型】拖到筛选器,选择“剧情”、“动作”、“喜剧”,确定。
③在智能显示选择饼图,并视图选为“整个视图”。
④将维度【类型】、度量【记录数】拖到标记卡的标签中。
⑤右键点击标签中的【总和(记录数)】,选择快速表计算,选择合计百分比。
⑥右键点击标签中的【总和(记录数)】,选择‘设置格式’,【默认值】区数字改为百分比,小数保留0位。


制作步骤:
①将标记选项卡“自动”改为“饼图”。
②将度量【记录数】拖到标记卡的角度,将维度【类型】拖到筛选器,选择剧情、喜剧、动作三种电影类型,然后将维度【类型】拖到标记卡颜色中。
③将度量【记录数】拖两次到行功能区,同时将右键点击行功能区上两个【记录数】,将度量(总和)改为最小值。右键点击记录数,选择“双轴”。
④在标记卡中其中一个“最小(记录数)”,点击“大小”,增大;在另一个“最小(记录数)”中,将标记卡中颜色的【类型】移除,并点击颜色,选择白色。
⑤在外圈(即刚刚放大的标记卡中),将【类型】、【记录数】拖到此中标签。并右键点击此【记录数】,选择快速表计算,选择合计百分比,然后设置格式,选择百分比,保留0位小数。
⑥选择内圈标记卡,将【记录数】拖进标签,即内圈显示三种电影的总记录数(提示:27461)。
⑦选择选项栏【工作表】,选择导出图片,去掉说明。

分析:
从环形图可以看出,剧情在三种类型中占绝大多数,而动作电影占据非常少,由此可以猜测剧情偏电影受众比较广,大部分电影是想通过剧情吸引观众,创造高票房。

5. 凸显表

制作各国家(产地)电影数量的二值凸显表,以1000为分界,超过1000的数据用红色显示,低于1000的数据用蓝色显示,给出大于1000的电影大国的名称,添加说明导出图像。

制作步骤
①将维度【产地】拖到行功能区。
②将度量【记录数】拖到标记卡的“颜色”、“标签”。
③点击标记卡“颜色”—“编辑颜色”,选择“红色-蓝色发散”,勾选“渐变颜色‘2阶,倒序,高级—中心[1000]。
④右键点击标记卡下方灰色区域,勾选”说明”,双击图表下发说明对话框,编辑说明内容。
⑤点击标记卡标签中的总和【记录数】,设置格式,选择【总和】中字体,更改颜色。

分析:同说明内容,德国、法国、韩国、美国、日本、英国、中国电影数量超过1000。

6. 树形图

制作电影产地与平均评分的树形图(以此命名),颜色选择红绿发散,显示出平均评分标签,通过动态筛选器剔除掉电影数量小于200的国家数据,给出分析,将分析加入到说明中,导出图像。

制作步骤
①将维度【产地】拖到行功能区,将度量【记录数】拖到列功能区。
②点击智能显示,选择树状图。
{此时,方块大小代表各国电影产量,颜色深度也代表电影产量,为了显示各国电影平均评分情况,需要将标记卡颜色中的度量【记录数】替换为度量【平均评分】}
③移除标记卡中颜色中的度量【记录数】,将度量【评分】拖到标记卡颜色,然后点击,将度量【总和】改为度量【平均值】。
④点击标记卡颜色,编辑颜色,选择红绿发散,勾选倒序。
⑤将度量【评分】拖到标记卡标签,更改为平均值。
⑥点击标记卡下方灰色区域,勾选说明,将分析加入到说明中。
⑦将度量【记录数】拖到筛选器,选择总数,最小值为200。PS:动态筛选器:在右侧灰色区域右键点击,勾选筛选器,选择记录数(总分),移动圆点,可以动态改变方块数量。双击上方的数字,也可以输入筛选值。

7. 气泡图

制作不同类型电影数量的气泡图,以不同颜色表示不同的电影类型,以电影数量表示气泡大小。

制作步骤
①将维度【类型】拖到行功能区,将度量【记录数】拖到列功能区。
②点击智能显示,选择气泡图。
③将维度【类型】拖到标记卡颜色中。

拓展:在上述基础上,如果还要考虑电影平均评分的情况,如何处理。

制作步骤
在上述基础上,移除标记卡颜色中的维度【类型】,替换为度量【评分】,并改为(平均值)。

8. 动态气泡图

制作步骤
①引入时间概念,将维度【上映时间】改为日期类型,拖到页面中,生成时间轴。
②在筛选器中放入维度【上映时间】剔除NULL,再放入维度【类型】选择需要的电影类型。
③将度量【记录数】拖到行功能区,将度量【累计票房】拖到列功能区。

9. 词云图

基于数量来展示电影类型的的词云图。

制作步骤
在气泡图的基础上,将标记中的气泡改为文本即可。

10. 标靶图

制作“2012年各国家电影产量”标靶图,上映时间为2012年,添加参考线和参考分布,参考线为常量——200,参考线颜色为黑色加粗,不显示标签;参考分布选择总量平均值百分比的50%和100%,参考分布线选择橙色加粗,中间为浅灰色,显示标签为计算。

标靶图:一般是在基本条形图的基础上,增加一些参考线或参考区间,帮助分析人员更加直观的了解两个度量之间的关系。一般比较计划值实际值

制作步骤
①将维度【产地】拖到列功能区,将度量【记录数】拖到行功能区,点击交换行和列。
②右键点击横轴,选择“添加参考线”。

分析:由上图可以看出,2012年美国、中国、日本电影产量超过200。英国、法国、韩国超过了平均值。

11. 符号地图

创建产地电影数量与评分(以此命名)的符号地图,处理未知位置信息,以颜色表示评分平均值,选择红绿发散,以电影数量表示圆形大小,显示产地标签,对数据进行分析。

制作步骤
①右键点击维度【产地】,地理角色——国家/地区,此时维度【产地】旁边出现

tableau数据分析实战作业相关推荐

  1. python第四章课后答案4.7_Python数据分析实战作业 第四章 Python数据分析实战 习题...

    第四章 Python数据分析实战 习题(数据见附件sizhang.xlsx) 班主任现有一班级的两张表,如下. 表一:成绩表 学 号C#线 代Python 16010203788896 表二:信息表 ...

  2. tableau数据分析实战:明星艺人数据分析

    文章目录 1.top20上榜次数分析 2.总量.日均量分析 3.比率分析 4.总结 本文数据来源于艾漫官网7月29日~8月13日共计16天的数据:其中热度用活跃粉丝数表示,活跃粉丝数指统计期内去除水军 ...

  3. 拉勾启源老师mysql讲义,【拉勾教育数据分析实战训练营】--Tableau学习笔记-重点回顾1...

    [拉勾教育数据分析实战训练营]--Tableau学习笔记-重点回顾1 [拉勾教育数据分析实战训练营]--Tableau学习笔记-重点回顾1 以下是我搜罗的一些官方优秀case分享: 1.https:/ ...

  4. tableau 实战练习数据源分享_数据分析实战训练营学习笔记

    数据分析思维与业务流程(已学习) 数据分析中预测未来.优化现状.总结规律的作用 数据分析师的职业需求与发展趋势 课程规划 行业业务模式.利润构成讲解 行业问题的确认与数据指标拆解思路 行业问题的解决流 ...

  5. 《Spark大数据分析实战》——1.4节弹性分布式数据集

    本节书摘来自华章社区<Spark大数据分析实战>一书中的第1章,第1.4节弹性分布式数据集,作者高彦杰 倪亚宇,更多章节内容可以访问云栖社区"华章社区"公众号查看 1. ...

  6. 三十四、R语言数据分析实战

    @Author : By Runsen @Date : 2020/5/14 作者介绍:Runsen目前大三下学期,专业化学工程与工艺,大学沉迷日语,Python, Java和一系列数据分析软件.导致翘 ...

  7. mysql数据生产数据分析_基于MySQL玩转SQL数据分析课程 互联网数据分析师-SQL数据分析实战视频教程...

    基于MySQL玩转SQL数据分析课程 互联网数据分析师-SQL数据分析实战视频教程 课程目录 (1)SQL与数Ju分析;目录中文件数:23个 (1) 开课-课时3SQL与数Ju库的价值.flv (2) ...

  8. 《R与Hadoop大数据分析实战》一1.6 HDFS和MapReduce架构

    本节书摘来自华章出版社<R与Hadoop大数据分析实战>一书中的第1章,第1.6节,作者 (印)Vignesh Prajapati,更多章节内容可以访问云栖社区"华章计算机&qu ...

  9. 在线教育数据分析实战项目案例

    数据分析实战项目案例 数据分析概览 数据分析经常遇到的问题 解决思路 常规产品指标 在线教育产品指标 市场效果广告指标 搭建指标系统流程 渠道的分类 针对搜索引擎,信息流广告如何稳定提高ROI 利用M ...

最新文章

  1. decimal在存储过程和C#中的应用
  2. wmic 获取运行内存大小
  3. 没有事业的女朋友(一个老总的感言)
  4. mysql官网二进制包_mysql二进制包安装与配置实战记录
  5. 用 JMeter 测量性能--测试您的 DB2 数据库
  6. 如何在Instagram上过滤冒犯性评论
  7. input子系统基础之按键4——输入核心层源码分析
  8. xtrabackup mysql8.0_Percona XtraBackup 8.0, 安装与测试
  9. 泰山游记:道阻且长,活着走出
  10. 智能语音机器人系统介绍
  11. C盘太小,调整磁盘分区大小
  12. 计算机病毒进化趋势,人类进化趋势是什么?
  13. 如何批量生成Code32条形码
  14. W10系统matlab无法保存对该路径的更改 pathdef_最新WIN10 20H2系统找回经典系统属性界面的几种方法...
  15. 思考分析常用思维模型
  16. 开源社 2023年度理事会成员官宣
  17. 模拟肯德基KFC快餐店收银系统
  18. Eclipse SVN 冲突的 介绍 及 四种解决方式
  19. 无源滤波器--低通滤波器(LPF)
  20. 【IAP】IAP在线升级流程

热门文章

  1. Java 设计模式(二)《建造者模式》
  2. 让 Web3 认证拥有和 Web2 一样丝滑体验的技术路径
  3. python用什么编译器
  4. 微信h5支付和公众号支付、支付宝h5支付
  5. Python会议室、酒店预订系统源代码
  6. python类方法和实例方法syntax errors_自己编程中遇到的Python错误和解决方法汇总整理...
  7. 醉汉漫步 Drunkard's walk
  8. echarta3 北京,上海地图
  9. 人脸检测颜值软件_智能人脸测试app下载-AI智能人脸测试软件(颜值测试) v1.0.0511_5577安卓网...
  10. ST-GCN源码分析