1.数据可视化

数据可视化在许多方面是数据分析过程的高潮。在这部分课程中,您将了解数据可视化所涉及的概念。您将了解可访问性、设计思维和其他在分析中的数据可视化方面发挥作用的因素。

1.1了解数据可视化

1.1.1有效的数据可视化

首先,您将回顾两个有助于思考如何在可视化中组织信息的框架。其次,您将探索注意力前属性以及如何使用它们来影响人们对您的可视化的看法。从那里,你’ 将快速回顾创建可视化时应牢记的设计原则。您将通过回顾一些可用于避免创建误导或不准确的可视化的实践来结束阅读。

用于组织您对可视化的想法的框架

框架可以帮助您整理关于数据可视化的想法,并为您提供有用的清单以供参考。在您创建自己的数据时,这里有两个可能对您有用的框架:

1) 麦坎德利斯法
您在关于有效数据可视化的第一课中了解了 David McCandless 方法,但作为复习,McCandless 方法列出了良好数据可视化的四个要素:

  1. 信息:您正在使用的数据

  2. 故事:清晰而引人入胜的叙述或概念

  3. 目标:视觉的特定目标或功能

  4. 视觉形式:隐喻或视觉表达的有效运用

注意:接近此框架的一种有用方法是注意图形中所有四个元素之间存在不完全重叠的部分。例如,没有目标、故事或数据的视觉形式可能是草图甚至是艺术。没有目标或功能的数据加上视觉形式是令人眼花缭乱的。有目标但没有故事或视觉形式的数据很无聊。所有四个元素都需要发挥作用才能创造出有效的视觉效果。

有效的视觉效果的要素是清晰的含义、对对比的复杂使用和精致的执行。

2) Kaiser Fung 的 Junk Charts Trifecta Checkup

这种方法是一组有用的问题,可以帮助数据可视化的消费者批评他们正在消费的东西并确定它的有效性。检查有三个问题:

  1. 什么是实际问题?

  2. 数据说明了什么?

  3. 视觉说明了什么?

注意:此清单可帮助您从受众的角度考虑您的数据,并确定您的视觉对象是否有效地将您的数据传达给他们。除了这些框架之外,还有一些其他构建块可以帮助您构建数据可视化。

1.1.2灵感无处不在

  • 数据可视化目录:不知道从哪里开始数据可视化?该目录包含一系列不同的图表、图表和图形,可帮助您找到最适合您项目的图表。当您浏览每个类别时,您将获得每个可视化的详细描述及其功能和类似视觉效果的列表。

  • 25 种最佳数据可视化:在这组图像中,探索制作令人惊叹的视觉效果的最佳数据示例。只需单击每张图片下方的链接,即可深入了解每个项目,并了解为什么使数据具有视觉吸引力如此重要。

  • 10 个数据可视化博客:每个链接都会将您带到一个博客,该博客是从数据讲故事到图形数据的所有信息的源泉。获取您的下一个好主意或只是浏览一些视觉灵感。

  • 信息是美丽的:这个画廊由 David McCandless 创立,致力于帮助您根据事实和数据做出更清晰、更明智的视觉决策。这些项目由学生、设计师甚至数据分析师制作,以帮助您深入了解他们如何获取自己的数据并将其转化为视觉叙事。

  • 数据工作室画廊:信息至关重要,但以易于理解的方式呈现的信息更有用。浏览此交互式图库并查找以视觉方式传达的不同类型数据的示例。您甚至可以使用数据工作室工具来创建您自己的数据驱动的视觉效果。

1.1.3相关性和因果关系

在本阅读中,您将更详细地研究相关性和因果关系。让我们回顾一下这些术语的定义:

  • 统计学中的相关性是衡量两个变量相互关联的程度。相关性的一个例子是“随着温度的升高,冰淇淋的销量也会上升”。重要的是要记住,相关性并不意味着一个事件会导致另一个事件。但是,它确实表明它们之间存在某种模式或相互关系。如果一个变量上升而另一个变量也上升,则为正相关。如果一个变量上升而另一个变量下降,则为负相关或负相关。如果一个变量上升而另一个变量保持不变,则没有相关性。

  • 因果关系是指事件导致特定结果的想法。例如,当雷击时,我们会听到雷击引起的空气加热和冷却引起的雷声(声波)。闪电引起雷声。

为什么区分相关性和因果关系很重要?

当您从数据分析中得出结论时,您需要确保当只有相关性时,您不会假设数据元素之间存在因果关系。当您的数据显示室外温度和冰淇淋消费量同时上升时,可能很容易得出结论,炎热的天气会导致人们吃冰淇淋。但是,对数据的仔细检查会发现,温度的每一次变化都不会导致冰淇淋购买量的变化。此外,在收集数据的同时可能有冰淇淋销售,您的分析中可能没有考虑到这一点。

当您从数据中得出结论时,了解相关性和因果关系之间的区别很重要,因为风险可能很高。接下来的两个例子说明了健康和人类服务的高风险。

  • 发病原因
    例如,糙皮病是一种具有头晕、疮、呕吐和腹泻症状的疾病。在 1900 年代初期,人们认为这种疾病是由不卫生的生活条件引起的。大多数感染糙皮病的人也生活在不卫生的环境中。但是,对数据的仔细检查表明,糙皮病是缺乏烟酸(维生素 B3)的结果。不卫生的条件与糙皮病有关,因为大多数买不起富含烟酸的食物的人也负担不起生活在更卫生的条件下。但是,肮脏的生活条件证明只是一种相关性。

  • 援助分配
    这是另一个例子。假设您正在为提供食品券的政府机构工作。您从该机构的 Google Analytics(分析)中注意到,有资格获得食品券的人正在浏览官方网站,但他们在没有注册福利的情况下离开了该网站。您认为访问该网站的人正在离开,因为他们没有找到注册食品券所需的信息。Google Analytics 可以帮助您找到线索(相关性),例如同一个人多次返回或人们离开页面的速度。其中一个相关性可能会导致您找到真正的原因,但您需要收集额外的数据,例如在调查中,以确切了解为什么来到该网站的人没有注册食品券。只有这样,您才能弄清楚如何提高注册率。

1.1.4奇妙的可视化世界

线条为你的数据添加了视觉形式,并帮助你建立可视化的结构。
形状创造了视觉对比,可以帮助区分不同的数据点,如地图上的不同国家的可视化。

histogram柱状图。一种数据可视化,显示数据值落入某些范围的频率
条形图。一种数据可视化,使用大小来对比和比较两个或多个值

  • 折线图
    折线图用于跟踪短期和长期的变化。当存在较小的变化时,折线图比条形图更适合使用。折线图还可用于比较多个组在同一时间段内的变化。
  • 条形图
    条形图使用大小来对比和比较两个或多个值,使用高度或长度来表示特定值。
  • 热图
    使用颜色对比来比较数据集中的类别
    与条形图类似,热图也使用颜色来比较数据集中的类别。它们主要用于显示两个变量之间的关系,并使用颜色编码系统来表示不同的值。以下热图绘制了每个城市在一年中最热和最冷月份的温度变化。
  • 饼形图
    饼图是一个圆形图,它被分成若干段,表示与其所代表的数量相对应的比例,尤其是在处理整体的各个部分时。
  • 散点图
    散点图显示不同变量之间的关系。散点图通常用于一组数据的两个变量,尽管可以显示其他变量。
    用没有连接线的单个数据点表示不同变量之间的关系。
  • 分布图
    分布图显示数据集中各种结果的分布。
    让我们将其应用于真实数据。为了说明其供应情况,一家全新的咖啡店老板想要测量他们的顾客喝了多少杯咖啡,并且他们想知道该信息是否取决于一周中的日期和时间。该分布图类似于以下内容:
    从这个分布图中,您可能会注意到咖啡销售量从一周开始稳步增加,在周中达到最高点,然后在接近周末时减少。
    如果结果在 x 轴上按不同的数值(或数值范围)分类,则分布变为直方图。如果从客户奖励计划中收集数据,他们可以对每周消费 1 到 10 杯咖啡的客户进行分类。直方图将有十列代表杯子的数量,列的高度将表示每周喝那么多杯咖啡的顾客数量。

回顾这些视觉示例中的每一个,您发现它们在哪里适合您的数据类型?回答这个问题的一种方法是评估数据中的模式。有意义的模式可以采取多种形式,例如:

  • 变化:这是随时间变化的观察趋势或实例。衡量数据变化的一个好方法是通过折线图或柱形图。

  • 聚类:具有相似或不同值的数据点的集合。这最好通过分布图来表示。

  • 相对:这些是与其他事物相关或成比例的观察结果。您可能已经在饼图中看到过相对论数据的示例。

  • 排名:这是成就或地位等级中的一个位置。需要排名的数据最好用柱形图来表示。

  • 相关性:这表明两个或多个事物之间的相互关系或联系。散点图是表示此类数据模式的绝佳方式。

1.1.5决策树

1.2设计数据可视化

我们要检查的元素是线,形状、颜色、空间和运动。

1.2.1设计的九个基本原则

  1. 平衡:当颜色和形状等关键视觉元素分布均匀时,数据可视化的设计是平衡的。这并不意味着您需要完全对称,但是您的可视化不应该让一侧分散注意力。如果您的数据可视化是平衡的,这可能意味着用于创建图形的线条两侧的长度相似,或者对象之间的空间相等。例如,这个柱形图(也如下所示)是平衡的;即使列的高度不同且图表不对称,列的颜色、宽度和间距仍使此数据可视化保持平衡。这些颜色相互之间提供了足够的对比度,因此您可以同时关注所显示的动力水平和能量水平。
  2. 重点:您的数据可视化应该有一个焦点,以便您的受众知道该集中在哪里。换句话说,您的可视化应该强调最重要的数据,以便用户首先识别它。使用颜色和价值是实现这一目标的一种有效方法。通过使用对比色,您可以确保图形元素以及这些元素中显示的数据脱颖而出。
    例如,您会注意到下面The Pudding 的“俚语来自哪里” 文章中的热图数据可视化。此热图使用颜色和值强度来强调搜索兴趣最高的状态。您可以直观地识别搜索的增加随着时间的推移,从低兴趣到高兴趣。这样,您可以在不知道具体数据值的情况下快速掌握所提出的关键思想。
  3. 运动:运动可以指观看者的眼睛在查看数据可视化时所经过的路径,或由动画创建的文字运动。数据可视化的运动应该模仿人们通常阅读的方式。您可以使用线条和颜色将浏览者的注意力吸引到页面上。
    例如,请注意此组合图中的平均线(如下所示)如何从左到右吸引您的注意力。虽然这个例子没有动,但它仍然使用运动原理来引导观众对数据的理解。
  4. 模式:您可以使用相似的形状和颜色在数据可视化中创建模式。这可以在许多不同的方面有用。例如,您可以使用模式来突出不同数据集之间的相似性,或者使用独特的形状、颜色或线条分解模式以创建更多重点。
    在下面的示例中,此堆叠柱形图(也如下所示)的不同颜色类别是一致的模式,可以更轻松地比较每列中按流派的图书销量。请注意,在图表中,奇幻和科幻类别(宝蓝色)随着时间的推移而增加,即使一般类别(绿色)保持不变。
  5. 重复:重复图表类型、形状或颜色会增加可视化效果。想想前面例子中的图书销售图表:颜色的重复有助于观众理解有不同的数据集。您可能会在我们迄今为止查看的所有示例中注意到这种重复。花一些时间回顾前面的每个示例,并注意重复创建有意义的视觉故事的元素。
  6. 比例:比例是另一种展示某些数据重要性的方式。使用各种颜色和尺寸有助于证明您正在引起对特定视觉的注意而不是其他视觉。如果您在仪表板中制作的一个图表比其他图表大,那么您就是在引起人们对它的注意。确保每个图表准确反映和可视化其中值之间的关系非常重要。在此仪表板(如下所示)中,饼图的切片大小和颜色与表中的数据相比有助于使每个人吃的甜甜圈数量成为焦点。

前六项设计原则是您在创建数据可视化时可以考虑的关键因素。完成数据可视化后,接下来的三个原则是有用的检查。如果您已经深思熟虑地应用了最初的六个原则,那么您可能已经在您的可视化中认识到这三个原则。

  1. 节奏:这是指在你的可视化中创造一种运动或流动的感觉。节奏与运动原理密切相关。如果您完成的设计没有成功创建流程,您可能需要重新排列一些元素以改善节奏。

  2. 多样性:你的可视化应该在你使用的图表类型、线条、形状、颜色和值上有一些变化。多样性使观众保持参与。但是找到平衡是件好事,因为太多的变化会使人们感到困惑。您包含的多样性应该使您的仪表板和其他可视化感觉有趣且统一。

  3. 团结:最后一个原则是团结。这意味着您的最终数据可视化应该是有凝聚力的。如果视觉是脱节的或没有很好的组织,它会令人困惑和不知所措。

1.2.2数据很漂亮

什么是好的可视化?是你使用的数据吗?或者,也许这就是它所讲述的故事?在本阅读中,您将通过探索 David McCandless 的成功数据可视化元素并基于这些元素评估三个示例,了解更多关于使数据可视化成功的原因。数据可视化可以改变我们的观点,让我们以新的、漂亮的方式注意到数据。一张图片胜过一千个字——在数据中也是如此!您可以选择保存在整个阅读过程中使用的所有数据可视化示例;这些是成功的数据可视化的很好的例子,你可以用它们来激发未来的灵感。

成功可视化的四个要素

David McCandless 的维恩图确定了成功可视化的四个要素:

  • 信息(数据):您试图传达的信息或数据是数据可视化的关键组成部分。没有信息或数据,您就无法成功地传达您的发现。

  • 故事(概念):故事允许您以有意义和有趣的方式分享您的数据。如果没有故事,您的可视化内容会提供丰富的信息,但不会真正鼓舞人心。

  • 目标(功能):数据可视化的目标是使数据有用和可用。这就是您试图通过可视化来实现的目标。如果没有目标,您的可视化可能仍然提供信息,但无法生成可操作的见解。

  • 视觉形式(隐喻):视觉形式元素赋予您的数据可视化结构并使其美观。没有可视化形式,您的数据还没有可视化。

所有这四个元素本身都很重要,但成功的数据可视化可以平衡这四个元素。例如,如果你的数据可视化只有两个元素,比如信息和故事,你就有了一个粗略的轮廓。这在您的早期计划阶段可能非常有用,但不够完善或提供足够的信息以供分享。即使是三个元素也不够——您需要考虑所有四个元素才能创建成功的数据可视化。

示例 1:犬种比较的可视化

检查四个要素

这种可视化将不同犬种的受欢迎程度与更客观的数据得分进行比较。考虑它如何使用成功的数据可视化元素:

  • 信息(数据):如果您查看数据,您可以探索可视化中说明的指标。

  • 故事(概念):可视化显示哪些狗被高估了,哪些被正确地忽略了,哪些是真正的热狗!而且,可视化揭示了一些您以前可能不知道的被忽视的宝藏。

  • 目标(功能):可视化有兴趣探索不同犬种的流行度和客观数据得分之间的关​​系。通过比较这些数据点,您可以更多地了解不同犬种是如何被感知的。

  • 视觉形式(隐喻):除了这个可视化的实际四方形结构外,其他视觉线索用于传达有关数据集的信息。最明显的是数据点被表示为狗符号。此外,狗符号的大小和狗符号面对的方向传达了有关数据的其他细节。

1.2.3可视化改进的设计思维

设计思维是一个用于以用户为中心的方式解决复杂问题的过程。它使数据分析员能够确定可视化的替代策略。

数据可视化的设计思维包括五个阶段:

  • 感同身受:思考数据可视化的目标受众的情感和需求。

  • 定义。弄清楚你的观众从数据中需要什么

  • 构思。产生数据可视化的想法

  • 原型化。将可视化放在一起进行测试和反馈

  • 测试。在利益相关者看到原型之前,向人们展示原型的可视化。

随着交互式仪表盘在数据可视化方面变得越来越流行,人们对效率和用户友好性给予了新的重视。在这篇阅读中,你将了解到设计思维是如何改进交互式仪表盘的。

示例:网上银行仪表板

假设您是一家银行的分析师,该银行刚刚在其在线银行应用程序中发布了一个新仪表板。本节介绍如何像新用户一样探索此仪表板,考虑用户的需求,并提出改进仪表板中数据可视化的想法。银行应用程序中的仪表板具有以下数据可视化元素:

  • 每月支出显示为圆环图,反映了公用事业、住房、交通、教育和杂货等不同类别。

  • 当客户为某个类别设置预算时,圆环图会在同一视图中显示填充和未填充部分。

  • 客户还可以设置总体支出限额,仪表板将根据过去的支出趋势自动将预算金额(圆环图的未填充区域)分配给每个类别。

  1. 感同身受

首先,设身处地为在银行有支票账户的客户设身处地地感同身受。

  • 颜色和标签在可视化中有意义吗?

  • 设置或更改预算有多容易?

  • 当您在圆环图中点击某个消费类别时,是否会显示该类别中的交易?

数据可视化的主要目的是什么?如果您回答是为了帮助客户保持预算或省钱,那么您是对的!省钱是仪表板的首要客户需求。

  1. 定义

现在,假设您正在帮助仪表板设计师定义客户除了省钱之外可能想要实现的其他事情。

  • 可能还需要哪些其他数据可视化?

  • 跟踪收入(除了支出)

  • 跟踪不完全符合设定类别的其他支出(有时称为可自由支配支出)

  • 还清债务

  1. 构思

接下来,构思仪表板的其他功能并与软件开发团队分享。

  • 哪些新的数据可视化可以帮助客户?

  • 除了标准的甜甜圈图,您还会推荐条形图或折线图吗?

  • 您是否建议允许用户创建自己的(自定义)类别?

  1. 原型

最后,开发人员可以使用新的和改进的数据可视化对下一个版本的仪表板进行原型设计。

  1. 测试

开发人员可以通过让您(和其他人)在将原型发送给利益相关者进行审查和批准之前对其进行测试来结束循环。

1.3探索可视化注意事项

标题:确保使用清晰、简明的语言,尽可能简单地解释所有信息。尽量避免使用缩写或首字母缩略词。

标题的排版和位置也很重要。最好是保持简单。把它加粗或比其他文字大几号,放在图表的正上方,向左对齐。

然后,用一个副标题进一步解释你的数据图表。副标题通过添加更多的背景和描述来支持标题。使用与图表其他元素相匹配的字体风格,并将副标题置于标题的正下方。

1.3.1突出显示关键信息的专业提示

突出的标题

标题是用大字印在可视化的顶部的一行字,以传达正在呈现的数据。它是吸引注意力的工具,使你的观众想要。

清楚的副标题

一个副标题通过增加更多的背景和描述来支持标题。添加副标题将帮助受众更好地理解与你的图表相关的细节。通常情况下,字幕的文字比标题的字体要小。

识别的标签

可视化中的标签可以确定数据与其他数据的关系。最常见的是,图表中的标签可以识别X轴和Y轴的内容。一定要确保给你的坐标轴贴上标签。

数据也可以直接在图表中标示,而不是通过图表图例。这使观众更容易理解数据点,而不必查找符号或解释图例中的颜色编码。

直接标注数据可视化有助于浏览者快速识别数据。图例往往不太有效,因为它们的位置远离了数据。

注释的重点

注释简要地解释了数据,或帮助观众关注可视化中数据的某一特定方面。

指南和专业提示

可视化组件 准则 风格检查
标题 - 内容:简要描述数据
- 长度:通常是指数据框的宽度
- 位置:在数据的上方
- 使用简短的语言
- 不要使用所有大写字母
- 不要使用斜体
- 不要使用首字母缩略词
- 不要使用缩略语
- 不要使用幽默或讽刺的语言
副标题 - 内容:澄清数据的背景
- 长度:与标题一样或比标题短
- 位置:在标题的正下方
- 使用比标题小的字体
- 不要使用未定义的词语
- 不要使用所有大写字母、粗体或斜体字
- 不要使用首字母缩略词
- 不要使用缩略语
标签 - 内容:取代图例的需要
- 长度:通常少于30个字符
- 位置:在数据旁边或轴的下面或旁边
- 只使用几个词
- 使用深思熟虑的颜色编码
- 使用标注来指向数据
- 不要使用全部大写、粗体或斜体
注释 -内容:引起对某些数据的注意
-长度:变化,受开放空间的限制
-位置:紧挨着注释的数据
- 不要使用全部大写、粗体或斜体
- 不要使用旋转文本
- 不要分散查看者对数据的注意力

1.3.2在 60 分钟内设计图表

每当您开始进行数据可视化工作时,请遵循这个 60 分钟的高级图表来指导您的思考。

  • 准备(5 分钟):为全面思考的环境创造必要的精神和物质空间。这意味着在考虑您拥有的数据的数量和类型的同时,让自己有空间集思广益您希望数据如何显示。

  • 说和听(15 分钟):通过进入“问题背后的问题”并建立期望来确定你的工作对象。提出问题并真正专注于利益相关者对您的项目的反馈,以帮助您磨练如何布置数据。

  • 草图和设计(20 分钟):草拟解决问题的方法。定义你的工作的时间和输出,以便清楚而简洁地了解你正在制作的内容。

  • 原型设计和改进(20 分钟):生成可视化解决方案并衡量其在准确传达数据方​​面的有效性。花点时间重复这个过程,直到产生最终的视觉效果。如果您查看多个视觉效果直到找到完美契合,那也没关系。

2.使用 Tableau 进行数据可视化:

Tableau 是一种工具,可以帮助分析师创建有效的数据可视化。在这部分课程中,您将了解有关 Tableau 及其用途的所有信息。您还将探索创造力和清晰度的重要性,同时适当地可视化您的发现。

2.1开始使用 Tableau

2.1.1电子表格和 Tableau 中的可视化

电子表格中的主要图表类型

  • 柱形图(垂直条形图):柱形图允许您按值显示和比较多个类别的数据。

  • 折线:折线图展示了一段时间内数据的趋势。最后一个折线图示例是可以包含折线图的组合图。请参阅组合图表类型的说明。

  • 饼图:饼图是一种可视化每个数据点代表的整体比例的简单方法。

  • 水平条:条形图的功能类似于柱形图,但水平翻转。

  • 面积:面积图允许您跟踪多个类别数据的价值变化。

  • 散点图:散点图通常用于显示数值数据的趋势。

  • 组合:组合图表使用多个视觉标记(如列和线)在一个可视化中展示数据的不同方面。下面的示例是一个组合图,它同时具有柱形图和折线图。

Tableau 中的可视化有何不同

Tableau 提供了一些电子表格中没有的独特图表。这些是帮助您在 Tableau 中选择图表类型的便捷指南:

Tableau 图表上的终极备忘单。本博客介绍了 Tableau 中的 24 种图表变体和使用指南。

以下是 Tableau 中更专业的可视化,带有示例链接或创建它们的步骤:

  • 高亮表看起来像带有条件格式的表格。

  • 热图显示数据中的强度或浓度。

  • 密度图显示浓度(如人口密度图)。

  • 甘特图在时间线上显示事件或活动的持续时间。

  • 符号地图在给定的经度和纬度上显示一个标记。

  • 填充地图是具有基于测量或尺寸着色的区域的地图。

  • 圆形视图显示数据的相对强度。

  • 箱线图也称为箱线图,显示沿图表轴的值分布。

  • 子弹图将主要度量与另一个度量进行比较,可以用来代替千分表图表。

  • 压缩气泡图以聚集的圆圈显示数据。

2.2在 Tableau 中创建可视化

Tableau、Looker 和 Google Data Studio 都提供拖放功能来创建可视化。 Tableau 提供基于浏览器和桌面的版本,而 Looker 和 Google Data Studio 则严格基于浏览器。 采用基于云的服务的公司首选基于浏览器的解决方案,而桌面解决方案可能适合在其专用网络上维护服务的公司。

Tableau 中的发散调色板按颜色强度显示值的大小,按色调显示值的范围。

数据讲故事涉及用视觉传达数据集的含义,并使用为您的受众定制的叙述。

要根据仪表板大小自动调整布局大小,分析师应使用平铺布局。

您可以选择使用过滤器来突出显示单个数据点或将对利益相关者重要的内容归零。

3.关于您的数据的故事

通过洞察力将您的目标与您的数据联系起来对于良好的数据故事讲述至关重要。在这部分课程中,您将了解数据驱动的故事及其属性。您还将了解如何使用 Tableau 创建仪表板和仪表板筛选器。

叙事有开头、中间和结尾; 将数据与项目目标联系起来; 并清楚地解释分析中的重要见解。

3.1使用 Tableau 仪表板

3.1.1动态和静态见解

实时与静态

识别数据是实时的还是静态的取决于某些因素:

  • 数据是多少年的?
  • 直到洞察力过时或不再有效地做出决策之前需要多长时间?
  • 这些数据或分析是否需要定期更新以保持价值?

静态数据包括在演示文稿中提供屏幕截图或快照,或使用数据快照构建仪表板。静态数据有利有弊。

优点

  • 可以严格控制数据和洞察力的时间点叙述

  • 允许向更广泛的受众深入解释复杂的分析

缺点

  • 洞察力立即开始失去价值,并且数据保持静态的时间越长,这种情况就会持续下去

  • 快照跟不上数据变化的步伐

实时数据意味着您可以构建连接到自动更新数据的仪表板、报告和视图。

优点

  • 可以将仪表板构建为更具动态性和可扩展性

  • 在需要时将最新数据提供给需要它的人

  • 允许对数据进行最新的策划视图,并能够为各种用例构建可扩展的“单一事实来源”

  • 允许对频繁更改的数据立即采取行动

  • 减少每次分析在流程上花费的时间/资源

缺点

  • 可以利用工程资源来保持管道的实时性和可扩展性,这可能超出了一些公司的数据资源分配范围

  • 如果没有解释数据的能力,您可能会失去对叙述的控制,这可能会导致数据混乱(即团队根据相同的数据得出相互矛盾的结论)

  • 如果数据处理不当,可能会导致缺乏信任

4.开发演示文稿和幻灯片

在这部分课程中,您将了解如何就您的数据分析进行有效的演示。您将在创建演示文稿时考虑分析的所有方面,并了解如何在您将共享的数据可视化中使用多个数据源。此外,您将学习如何预测可能出现的潜在限制和问题,以及如何为利益相关者提供有用的答案。

假设的目的是对您的数据进行理论化。数据分析师使用它们来确定他们想要证明或反驳的内容。

初始假设是您试图用数据证明或反驳的理论。初始假设的示例包括:在线销售数量的增加导致年收入增长的趋势、假日季节与交通拥堵加剧之间的关系,以及年降雨量创纪录的野生动物数量增加。

McCandless 方法的步骤包括:

  1. 按名称介绍图形

  2. 在被问到之前回答明显的问题

  3. 陈述你的图形的洞察力

  4. 调用数据来支持这种洞察力

  5. 告诉你的听众为什么它很重要

4.1确定演讲技巧和实践

4.1.1指南:在演示文稿中共享数据发现

讲述您的数据故事(展示数据和结果的提示和技巧)

使用以下提示和示例布局来构建您自己的演示文稿。

提示 1:了解您的流程

就像任何好的故事一样,数据故事必须有好的情节(主题和流程)、好的对话(谈话要点)和好的结局或大的揭示(结果和结论)。一个流程可以是对所分析内容的概述,然后是结果趋势和进一步探索的潜在领域。

为了为您的演示制定正确的流程,请牢记您的听众。问自己这两个问题,以帮助您定义整体流程并构建您的演示文稿。

谁是我的观众?

  • 如果您的目标受众是高管、董事会成员、董事或其他 C 级 (C-Suite) 高管,则您的故事讲述应该保持在高水平。这些观众会想听听你的故事,但可能没有时间听完整个故事。高管倾向于关注鼓励改进、纠正或发明事物的结局。保持您的演示简短,并将大部分时间花在您的结果和建议上。请参阅本阅读中即将出现的主题——提示 3:以您的建议结尾。

  • 如果您的目标受众是利益相关者和经理,他们可能有更多时间了解您是如何执行分析的,并且他们可能会提出更多针对数据的问题。准备好有关导致您得出最终结果和结论的分析方面的谈话要点。

  • 如果您的目标受众是其他分析师和个人贡献者,那么您将拥有最大的自由——也许是最多的时间——更深入地研究数据、流程和结果。

我演讲的目的是什么?

  • 如果您的演示文稿的目标是在最后提出请求或推荐某些内容,例如推销,您可以让每张幻灯片都朝着最后的建议工作。

  • 如果您的演示文稿的目标是专注于分析结果,那么每张幻灯片都可以帮助标记出结果的路径。一定要包含大量的面包屑(数据分析步骤的视图)来展示你处理数据的路径。

  • 如果您的演示文稿的目标是提供有关数据分析的报告,您的幻灯片应清楚地总结您的数据和主要发现。在这种情况下,让数据成为明星或为自己说话是可以的。

提示 2:准备谈话要点并限制幻灯片上的文字

当您在演示文稿中创建每张幻灯片时,请针对您将要说的内容准备谈话要点(也称为演讲者备注)。

不要忘记,在您的听众正在阅读您的幻灯片的同时,您也会说话。如果您的幻灯片开始变得更像文档,您应该重新考虑要说的内容,以便可以从幻灯片中删除一些文本。让您的听众轻松浏览幻灯片,同时仍然注意您在说什么。一般来说,遵循五秒规则。您的观众不应该花费超过五秒钟的时间阅读幻灯片上的任何文本块。

在整个演示文稿中解释每张幻灯片时,确切地知道你会说什么也可以为你的故事创造一个自然的流程。谈话要点可帮助您避免话题之间的尴尬停顿。总结数据的幻灯片也可能是重复的(和无聊的)。如果你准备了各种关于数据的有趣的谈话要点,你可以让你的听众保持警惕并关注数据及其分析。

提示 3:以您的建议结束

爬山时,登顶是目标。在演讲结束时提出建议就像到达山顶一样。

  • 最后使用 一张幻灯片作为您的建议。简洁明了。

  • 如果您建议做某事,请提供后续步骤并描述您认为成功的结果。

提示 4:留出足够的时间进行演示和提问

假设您的听众中的每个人都很忙。通过以下方式使您的演示文稿保持主题并尽可能简短:

  • 意识到你的时机。这适用于幻灯片的总数和您在每张幻灯片上花费的时间。

  • 有效地展示您的数据。确保每张幻灯片都讲述了数据故事中独特而重要的部分。如果一张幻灯片不是那么独特,您可能会考虑将该幻灯片上的信息与另一张幻灯片相结合。

  • 为最后的问题留出足够的时间,或者在整个演示过程中留出足够的时间来回答问题。

把它们放在一起:你的幻灯片布局

在本节中,我们将描述如何将所有内容放在一个示例幻灯片布局中。


第一张幻灯片:议程
提供您将涵盖的主题的高级项目符号列表以及您将在每个主题上花费的时间。每个公司的规范都不同,但一般来说,大多数演示文稿最多持续 30 分钟到一个小时。以下是 30 分钟议程的示例:

  • 介绍(4 分钟)

  • 项目概述和目标(5 分钟)

  • 数据和分析(10 分钟)

  • 建议(3 分钟)

  • 可操作的步骤(3 分钟)

  • 问题(5 分钟)

第二张幻灯片:目的
每个人可能都不熟悉您的项目或不知道它为什么重要。他们没有像你那样在过去的几周里思考你的项目的分析和结果。这张幻灯片总结了该项目的目的以及为什么它对您的受众的业务很重要。

以下是目的陈述的示例:

服务中心整合是一项重要的成本节约举措。该项目的目的是确定服务中心整合对客户响应时间的影响。

第三张幻灯片:数据/分析
首先,如果您总结了有关数据和分析的关键内容,则确实可以在一张幻灯片中讲述您的数据故事。您可能会在演示文稿末尾的附录中提供带有附加数据或信息的支持幻灯片。

但是,如果您选择使用不止一张幻灯片来讲述您的故事,请记住以下几点:

  • 幻灯片通常具有完全构建故事的逻辑顺序(开头、中间和结尾)。

  • 每张幻灯片都应该在逻辑上介绍它后面的幻灯片。幻灯片中的视觉提示或谈话要点中的口头提示应该让听众知道您何时会继续下一张幻灯片。

  • 切记不要在幻灯片上使用过多的文字。如有疑问,请参考第二条关于准备谈话要点和限制幻灯片文本的技巧。

  • 人们从幻灯片中阅读的高级信息不应与您在谈话要点中提供的信息相同。两者之间应该有一个很好的平衡来讲述一个好故事。您不想简单地阅读或说出幻灯片上的文字。

如需幻灯片上的额外视觉效果,请使用动画。例如,您可以:

  • 当您在幻灯片上讨论每个要点时,一次淡入一个要点。

  • 仅显示与您正在谈论的内容相关的视觉效果(淡出不相关的视觉效果)。

  • 使用箭头或标注指向您正在使用的视觉对象的特定区域。

第四张幻灯片:建议
如果您在之前的幻灯片中讲得很好,那么这些建议对您的听众来说将是显而易见的。这时您可能会收到很多关于您的数据如何支持您的建议的问题。准备好传达您的数据如何以不同方式支持您的结论或建议。如果有人对一个特定的解释有困难,用多个词来陈述同一件事也会有所帮助。

第五张幻灯片:号召性用语
有时,号召性用语可以与建议幻灯片结合使用。如果推荐了多项操作或活动,最好单独使用一张幻灯片。

回想一下我们的目的陈述示例:
**服务中心整合是一项重要的成本节约计划。该项目的目的是确定服务中心整合对客户响应时间的影响。

假设数据分析显示服务中心整合对客户响应时间产生了负面影响。号召性用语可能是检查是否需要更改流程以使客户响应时间恢复到整合之前的水平。

4.1.2评估您的演示文稿

演示评估清单:

  • 我是否使用引人注目的开口?

  • 我是从宽泛的想法开始,然后再谈具体的细节吗?

  • 我会说短句吗?

  • 显示数据可视化后我会暂停五秒钟吗?

  • 我会在某些时候故意停顿吗?

  • 我是否保持句子的音高?

  • 我是否有目的地站着不动?

  • 我的姿势好吗?

  • 我说话时是否看着我的听众(或相机)?

  • 我的信息是否简洁?

  • 最后我是否会向我的听众解释为什么数据分析很重要?

现在,对幻灯片执行相同的操作:

  • 我是否包含一个好的标题和副标题来描述我将要展示的内容?

  • 我是否包括我的演示文稿的日期或我的幻灯片上次更新的日期?

  • 我的字体大小是否能让观众轻松阅读我的幻灯片?

  • 我是否展示了我使用的业务指标?

  • 我是否包含有效的视觉效果(如图表和图形)?

4.1.3准备问答

在从事任何项目时,从一开始就了解利益相关者对您的期望是很重要的。此阅读将全部是关于在计划数据收集和演示之前准备要问的问题。

在您开始提出和回答可能的问题之前,有很多事情需要考虑——比如目标、利益相关者的期望以及是否有任何限制。在开始之前,请确保您已涵盖所有内容。下面的清单确定了您应该参与的十项任务,以便为您的问答做好充分准备:

演讲前

  1. 收集并准备您的问题。

  2. 与您的经理、其他分析师或您组织中的其他友好联系人讨论您的演示文稿。

  3. 询问经理或其他分析师过去您的特定受众通常会问什么样的问题。

  4. 在你的分析文件或你的分析文件上寻求评论、反馈和问题。

  5. 至少在演示前 24 小时,尝试头脑风暴您可能遇到的棘手问题或不清楚的部分——这有助于避免意外。

  6. 练习你将要展示的内容、解释任何缺失的信息或只是让你的神经平静下来,这永远不会有什么坏处。

在演示过程中

  1. 准备好对你发现的事情做出回应,并有效、准确地解释你的发现。

  2. 解决可能出现的潜在问题。

  3. 避免让一个问题使演示脱轨,并建议离线跟进。

  4. 将补充的可视化和内容放在附录中以帮助回答问题。

CHAP6:通过可视化艺术共享数据相关推荐

  1. D3临摹作业_数据采集(西安交大国家艺术基金数据可视化培训第27天)

    第十一章  数据可视化之数据采集 第一节 python爬虫基础 一 .爬虫概述 URL由三部分构成:协议://用户名:密码@子域名.域名.顶级域名:端口号/目录/文件名.文件后缀?参数=值#标志 二. ...

  2. 数据可视化笔记1 数据可视化简介(简史、分类、功能、目标)

    文章目录 1.什么是数据可视化 2.为什么要数据可视化 3.数据可视化简史 4.数据可视化的分类 5.数据可视化的功能 6.数据可视化的目标 7.数据可视化工具 1.什么是数据可视化 数据可视化: 创 ...

  3. redshift教程_分析和可视化Amazon Redshift数据—教程

    redshift教程 目录 (Table of Contents) Introduction 介绍 Setting up an Amazon Redshift Datasource 设置Amazon ...

  4. Python数据可视化2018:数据可视化库为什么这么多?

    本文最初发布于Anaconda开发者博客,经原作者授权由InfoQ中文站翻译并分享. 在奥斯汀举行的SciPy 2018年特别会议上,大量开源Python可视化工具的代表分享了他们对Python数据可 ...

  5. [数据分析与可视化] Python绘制数据地图2-GeoPandas地图可视化

    本文主要介绍GeoPandas结合matplotlib实现地图的基础可视化.GeoPandas是一个Python开源项目,旨在提供丰富而简单的地理空间数据处理接口.GeoPandas扩展了Pandas ...

  6. 使用内存映射文件在进程之间共享数据

    数据共享方法是通过让两个或多个进程映射同一个文件映射对象的视图来实现的,这意味着它们将共享物理存储器的同一个页面.因此,当一个进程将数据写入一个共享文件映射对象的视图时,其他进程可以立即看到它们视图中 ...

  7. python跨文件全局变量_Python 进程之间共享数据(全局变量)的方法

    进程之间共享数据(数值型): import multiprocessing def func(num): num.value=10.78 #子进程改变数值的值,主进程跟着改变 if __name__= ...

  8. R语言ggplot2可视化在特定数据点添加竖直的虚线实战:Add a dotted vertical line on certain x-axis values

    R语言ggplot2可视化在特定数据点添加竖直的虚线实战:Add a dotted vertical line on certain x-axis values 目录 R语言

  9. R语言使用tidyquant包的tq_transmute函数计算持有某只股票的天、月、周收益率、ggplot2使用条形图(bar plot)可视化股票年收益率数据使用不同的色彩表征正收益率和负收益率

    R语言使用tidyquant包的tq_transmute函数计算持有某只股票的天.月.周收益率.ggplot2使用条形图(bar plot)可视化股票年收益率数据使用不同的色彩表征正收益率和负收益率( ...

最新文章

  1. 企业网站前端制作实战教程 JQuery CSS JS HTML 项目需求分析与准备工作
  2. [跟我学中小企业架构部署]之一:整体架构设计
  3. Oracle加快终止对以往Java版本的免费支持期
  4. 大数据之-Hadoop完全分布式_虚拟机环境准备---大数据之hadoop工作笔记0030
  5. O2O、C2C、B2B、B2C的区别
  6. springboot与docker整合
  7. React学习笔记2017-12-31
  8. 数据分析方法(营销模型篇)--最全的9种分析方法
  9. java无头浏览器_java – 使用无头浏览器的Android Web Scraping
  10. netperf测试内网网络性能
  11. axio深入实例以及配置
  12. NLP入门(七)中文预处理之繁简体转换及获取拼音
  13. linux 时间戳计数器,用时间戳计数器测量频率的方法(下)-测试测量-与非网
  14. 花青素荧光染料2247688-56-6,Cyanine3 amine,Cy3-NH2,花青素Cyanine3氨基,可以用来标记蛋,抗体,多肽等
  15. 2022年初级经济师考试测试题及答案
  16. 使用C++,用四阶Runge-Kutta的方法来求解一阶常微分方程
  17. 滤波器频率响应的归一化
  18. Java 3DES加密解密(Commons.Codec Base64)
  19. 计算机丢失rtl100.bpl,处理“未曾找到 rtl100.bpl,因而这个利用过程未能启用。重新安装利用过程可能会修复此问题。”...
  20. macOS系统安装NMAP扫描工具

热门文章

  1. 希望之路:市政道路拉线法定标高
  2. 番外篇(1)模块次序表、代数环及其检测算法
  3. Html5禁止浏览器后退,多页面网站禁用浏览器后退键
  4. 管理会计习题集及答案 1-4章
  5. 系统在此应用程序堆栈溢出_Web应用程序:在开始之前选择正确的技术堆栈
  6. 如何实现云时代的高效运维?
  7. 肯德基微信小程序连接服务器异常,微信小程序平台常见问题及解决方案
  8. 新能源汽车行业研究报告
  9. c语言输出大数,C语言数据输出大汇总
  10. oracle数据库归档模式修改ARCHIVELOG