Dolphinsight(DI)是一款支持多种数据源的交互式大数据应用程序。DI 的目标用户包括:数据科学家,BI 开发人员以及任何使用数据并渴望通过简单的交互式拖放方式查找数据洞察的人员。 Dolphinsight 由 Dolphinsight 团队(DIT)开发。 大数据的特征是数据类型繁多、数据量巨大、数据生产速度快、价值密度低,如何快捷地发现数据背后隐藏的信息和知识,更好地利用数据资源并发挥数据优势,是大数据时代众多应用领域的迫切需求。

对于复杂的高维异构大尺度数据,传统的数据分析方法往往通过对数据的简化和抽象,隐藏了数据集真实的结构。而数据可视化则是另一种思路,它还原乃至增强了数据的全局结构和具体细节,避免了先验知识对用户的误导,通过合理的设计将数据呈现为用户易于感知的可视图形符号,让用户交互地理解数据背后隐藏的规律,洞察数据的内在价值。

本场 Chat 带领大家看透可视化的本质问题,从设计的角度讲述数据可视化技术,而非可视化实现算法。

本场 Chat 通过演绎可视化设计的基本流程、常用工具和方法,加上针对典型数据类型可视化方法的案例分析,以启发学员思考,达到以更加丰富的可视化方法,运用各种交互设计手段进行可视化分析与探索,深入挖掘自身现有业务数据价值的目的。通过学习,希望能够推动可视化技术在数据相关领域中的应用水平。

本场 Chat 主要内容:

  • 数据可视化概述。

    • 什么是数据可视化?
    • 为什么需要数据可视化?
    • 什么是好的可视化设计?
  • 数据可视化交互。
    • 为什么需要交互?
    • 可视化中的典型交互操作及实例分析。
    • 解决数据复杂性的四种典型交互模式及实例分析。
    • 交互设计的一般原则。

作为国内顶级数据可视化开发团队 DolphinSight 的一员,如何在数据中发现美好是我们每天都在探讨和努力追求的。本文将尝试从数据可视化的定义、价值、应用设计三个方面讲述和解释关于数据可视化。

什么是数据可视化?

简单描述就是让你对数据的感受更直观。

对数据可视化的定义,数据可视化指综合运用计算机图形学、图像、数学、人机交互等技术,将采集或模拟的数据映射为可识别的图形、图像、视频或动画,并允许用户对数据进行交互分析的理论、方法和技术,也常说成“3+2”(文字、图表、图像+声音、动画)。

为什么要进行数据可视化?

在这个信息爆炸的时代,如果挖掘信息的价值,如何让信息最简单直观,高效快速的传递,已经成为我们每天都在思考的问题。数据可视化就是在这样的大环境下诞生了。而人类右脑记忆图像的速度比左脑记忆抽象的文字快 100 万倍。因此,数据可视化能够加深人对于数据的理解和记忆。

怎样实现数据可视化?

创造和使用工具体现人类智慧。DolphinSight 是我们推荐的工具,也要推荐一下其它工具如 Tableau、海致、FineBI 等。任何形式的数据可视化都离不开丰富的内容、引人注意的视觉效果、精细的制作三个要素组成,概括起来就是新颖、充实、高效、美感四个特征。广义的数据可视化包括数据的采集、分析、治理、管理、挖掘在内的一系列复杂数据处理。

下面说下怎样做出好的数据可视化。

做一个好的数据可视化就像设计一个网站一样。它从一个概念、目标、甚至是线框开始。最大的区别是 infographic 的所有信息都包含在一个单元中,而一个网站有多个页面和方法来吸引用户,挑战是你要把 infographic 想象成一个平面或静态的微型网站。下面说下做出一个完美的数据可视化设计的五个基本要素。

1. 讲一个故事

一个好的信息图表从一个可靠的故事开始。这通常是基于一些可视化的数据,以使其更容易理解。数据可视化只是使信息更易于理解和理解的一种方式。出于信息图表的目的,这个故事可能需要简练。就像我们面对面的交流,眼睛,表情,一个微笑的动作。效率高,易理解,信息量大。

2. 视觉风格

信息图表需要强大的视觉效果来吸引用户。大多数信息图是从左到右,从上到下,以比水平格式更垂直的方式阅读。这种风格是设计的,因为它反映了自然的眼动和阅读模式。信息图之所以吸引人,是因为它们模仿了我们大脑的运作方式。这种视觉上的信息表示更容易思考、理解和保留。

(1) 色相、饱和度、明度

色相就是大家所说的红色、绿色等色彩;饱和度是指颜色的纯度;明度标识颜色的明暗程度。

(2) 暖色和冷色

暖色比冷色看起来占用面积大。因此,即使红色和蓝色占用相同的面积,前者还是会从视觉上压倒后者。暖色看起来距离近,而冷色则看起来越来越远。

(3) 四原色和三原色

青、品红、黄和黑是打印机用来完成四色印刷的四种墨水,这四种颜色按一定比例调制便可得到各种颜色。

红、绿、蓝光源被混在一起用来显示电脑屏幕和电视显示器的颜色,色彩成分的范围都是从零到最高值 255。

3. 字体与层次结构

信息图表的大字体就是你的脊梁。 与任何其他设计项目一样,创建一个带有一两个字体的排版板。但是不要害怕让字体比一般的字体大。确保为这些元素选择了字体,这些元素是粗体的,但不是压倒性的。不要害怕使用颜色、粗体或黑色的人物风格,以及来自同一类型的家庭的多重变化——粗体、斜体、规则、帽子等等——以提供最大的影响。

设计四原则:

(1) 对比(Contrast):如果两个项不完全相同,就应当使之不同,而且应当是截然不同。

(2) 重复(Repetition):设计的某些方面在整个作品中重复。

(3) 对齐(Alignment):任何元素都不能在页面上随意安放。每一项都应当与页面上的某个内容存在某种视觉联系。

(4) 亲密性(Proximity):将相关的项组织在一起,使它们的物理位置相互靠近相关的项将被看作凝聚为一体的一个组。

4. 足够的空间

因为信息图可以在一个小容器中包含大量信息,所以留白很重要。利用空间将用户吸引到特定的信息,并提供重点。在用户消化信息的时候给他们一个休息的机会。空间还可以帮助平衡重文本元素、大的或复杂的图像或信息,并使整体设计感觉易于管理。一些设计师几乎陷入了老式报纸版面设计陷阱,在设计信息图表时,每一块画布都必须包含信息。不要让这种事发生在你身上。白和的信息一样重要。

5. 一致性

你要讲的故事一定要连贯,不能跑题,跟写作文一样,要有中心思想。

建议大家不要把一类话题的信息弄乱,信息要模块化。信息图表应该向听众提供简洁、精简的信息。就像去超市是买日常用品,去餐馆是吃饭。好的信息图表是可以即时抓取用户,让用户有足够的深度来鼓励阅读和思考这个话题。创建更好的信息图表的最好方法是多借鉴。

接下来的给大家分享一些好用的工具,介绍一些比较经典的数据可视化设计!

数据可视化交互

为什么需要交互?

数据可视化的交互是让我们可以和数据交流,我跟数据说我想用什么,数据把他多我们内容的理解用某种方式展现。只看简单的少量数据,你可能感觉交互不是很有用,但如果你看到成百上千的数据,可能就超过人脑理解的极限了。那有什么办法解决呢?

人类学家会告诉我们:“人类通过大脑的视觉系统, 可以迅速的识别、贮存、回忆起图形信息,本能地将图形信息中的理念转化为长期记忆。”就是说我们的大脑处理图像信息很强,能更容易的把图像信息转化为记忆,便于理解和介绍。所以我们想让数据通过图像的方式与我们交流沟通。

可视化中的典型交互操作及实例分析

我用 DolphinSight 给大家截图演示:

图中所示为医疗各种角色某一时间段内患者信息的数据。

如果用 SQL 查询查询语句是这样的:

select 城市名,count(1) from 患者信息表名  group by 城市名

查询出来的结果表大概是这样的:

这样的数据不利于理解操作有比较繁琐,工作量大,收效甚微。通过我们对数据的理解去拖拽,交互统计通过匹配各种可能表达可以实现的方案,我们选择方案,显示方案执行效果。这里我们选择的是柱状图。

柱状图适合表现那些数据?

一般情况下,柱状图多用于反应数值的对比关系,具体可以归纳为以下三种:

  1. 数据随着某一变量的规律变化或不规律变化
  2. 不连续数据间数值的对比
  3. 部分和整体的对比

通常数据可视化并不是由一种图表构成的,而是由多种图表共同说明一个问题的。

一般情况下,交互设计师得到需求后最先要判断的是这一组数据是定量分析所得还是定性分析所得,这是一个很关键的环节,因为它直接决定这组数据的界面交互方式。根据需求,我判断这一组数据是定量分析所得结果,我想要的信息是不同城市来医院就诊患者的多少。可以归类于不同数据间的对比与部分与整体的对比两种关系。(数据间可以用柱状图,整体与部分可以用饼状图)

四种典型交互模式及实例分析

四种典型交互模式分别是动态改变视图、多视图关联、视图内容约减、焦点+上下文。

动态改变视图

我们先在概念上理解,随时间的推移动态显示当前时间点的图表。满足这样的图表有,地图导航实时显示我们当前的位置信息,实时监控大屏 dashboard:

图表动态的实时的发生变化。实时有他的使用场景,如果我们要根据前两年的数据分析第三年的销售情况,如果实时意义就不大,实时要的是操纵数据,用于日常监控的并不是真正的分析层面。

多视图关联

多视图是指将显示区域划分为多个视图或图层,是降低数据复杂性的一种方式。它包括采用同一编码方式编码多个数据子集的小多组图,以及采用不同的编码方式编码同一数据集的多样式图(多视图)。

通过并列放置、图层叠加 ,联动等方式解决数据量太大显示不下的问题,解决导航方向迷失问题。我用 DolphinSight 的 dashboard 做演示。

当我们操纵其中一个图的时候,当前图的选择的标签作为其他图的条件,更新图表显示,实现多图关联,一张图表动过这样的交换实现了需要很多图表才能实现的效果并且效果更好。

视图内容约减

它有三个优点:减少显示内容、只显示最感兴趣的、用户主动过滤信息或聚合信息。

我上面说到的仪表盘在选择条件的时候会有关联视图的隐藏。

焦点+上下文(focus+contex)

将选定元素的详细信息——焦点(focus),嵌入到同一视图中的概览信息图,即上下文(contex)中。技术在显示一个小的中心焦点区域的。同时,能够保持一个较大周围区域的可见性。这种技术可以将一个信息集合的特定部分的细节视图,通过某种方式和该信息集合的总体结构视图混合在一起。比较典型的应用就是我们去售楼处看到的交通图。

我觉着这种图最能说明焦点上下文这个概念典型应用。

总结:动态改变视图强调的是图表随数据的变化而变化,多视图关联强调的是视图和视图间的数据同步联动。视图内容约减强调的是无效信息的隐藏。焦点+上下文强调的是重要信息的突出显示。要做出一个好的可视化图表这四点缺一不可。

交互式设计的一般原则

通过以上四点我们应该理解了数据可视化的基本概念和要遵守的原则以及应用方法。下面我们从设计的角度说下交互式设计的一般原则。

一个页面只做一件事,去除杂乱

用户的注意力非常珍贵,我们也要根据用户的注意力进行设计。杂乱的界面展示了过多的信息,让你的用户非常的累:每一个加进去的按钮、图片、文字都会使界面更加复杂。

一屏一个主要操作。对于使用者,你设计的每一个页面应该仅提供一个具有真正价值的单一操作。这会让你的应用更易上手,更易使用,必要时也更容易添加功能。100 个清晰的屏幕比 1 个杂乱的屏幕更好。

这样的界面及时你看不懂中文和英文你都能猜到他要让你干什么吧?

让导航更加明显 不言自明

导航确保用户在跳转时不迷路,告诉用户当前在哪,可以去哪,如何回去等问题。全局导航需要使用清晰明了的视觉图形,无须解释。所有导航必须一致,不要再不通过页面内隐藏或移动导航

对操作友好的点击目标

按钮的大小要考虑点击方便,取消按钮小了一点,可以有效的防止误点,按钮本身已经有表达功能了。

我们在开发这个数据可视化软件的时候,一直强调五步原则。说的就是五个下一步实现数据的可视化分析,图表显示。

最后总结下设计的初心:

“如无必要,勿增实体”,即如有两个功能相等的设计,那么选择最简单的。奥卡姆剃刀的原则不是求真,而是求简。因为我们可以对本体世界做出无数多个可能的论述,这些论述都有可能是对的,但都不一定是对的,甚至这些论述在使用起来的时候得到的结果会是一样的。而为了方便,我们只能选择最简单的那个。


本文首发于GitChat,未经授权不得转载,转载需与GitChat联系。

阅读全文: http://gitbook.cn/gitchat/activity/5b27b7f19939ff7cdb646909

您还可以下载 CSDN 旗下精品原创内容社区 GitChat App , GitChat 专享技术内容哦。

用 Dolphinsight 实现数据可视化相关推荐

  1. 【置顶】利用 NLP 技术做简单数据可视化分析教程(实战)

    置顶 本人决定将过去一段时间在公司以及日常生活中关于自然语言处理的相关技术积累,将在gitbook做一个简单分享,内容应该会很丰富,希望对你有所帮助,欢迎大家支持. 内容介绍如下 你是否曾经在租房时因 ...

  2. 只要5分钟用数据可视化带你看遍11月份新闻热点事件

    2017年11月份已经离我们而去,在过去的11月份我们也许经历了双十一的剁手,也可能亲眼看见了别人剁手.11月份的北京大兴区发生了"11·18"重大火灾,国内多家幼儿园也多次上了头 ...

  3. 机器学习PAL数据可视化

    机器学习PAL数据可视化 本文以统计全表信息为例,介绍如何进行数据可视化. 前提条件 完成数据预处理,详情请参见数据预处理. 操作步骤 登录PAI控制台. 在左侧导航栏,选择模型开发和训练 > ...

  4. 2021年大数据ELK(二十七):数据可视化(Visualize)

    全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 数据可视化(Visualize) 一.数据可视化的类型 二.以饼图展示404与 ...

  5. legend位置 pyecharts_实验|pyecharts数据可视化分析-1

    1. 实验介绍 本实验主要介绍pyecharts基本特点与属性. 1.1. 实验目的 了解pyecharts功能.特点.与安装方式. 1.2. 知识点 pyecharts特点 pyecharts图表 ...

  6. matlab数据可视化总结,机器学习----Matlab数据可视化总结(plot篇)

    前言 通过资料的整理,使用Matlab语言的plot函数将数据可视化,plota函数也是一个比较常用的二维绘图函数,针对向量或矩阵.如果你也想试一试,初学者记得使用clf.close或close al ...

  7. graphpad做折线图坐标轴数字_pandas做数据可视化具体操作,快来看看吧

    常见的数据可视化库有: matplotlib 是最常见的2维库,可以算作可视化的必备技能库,由于matplotlib是比较底层的库,api很多,代码学起来不太容易. seaborn 是建构于matpl ...

  8. GitHub开源城市结构公交路线数据可视化

    本开源项目用公交路线数据,还原城市结构,通过数据可视化手段,还原了 30 多个城市的城市结构. 该项目中有数据获取和处理的脚本,而且该项目充分体现了数据可视化带来的便利和效果,易于激发学习编程的热情. ...

  9. 【seaborn】(1) 数据可视化,绘图风格、布局

    各位同学好,今天和大家分享一下如何使用 seaborn 库进行数据可视化.在 matplotlib 的基础上进一步美化绘图.主要内容有:默认风格 sns.set(), 主题风格 sns.set_sty ...

最新文章

  1. android 怎么判断activity 从哪里启动的
  2. Myeclipse开发内存溢出问题
  3. Python脚本监控线上AMQ Number of Pending Messages数量
  4. python 容器类型_Python容器类型公共方法总结
  5. python元组排序_python元组怎么排序
  6. 带图破解无源晶振与有源晶振知识
  7. arcgis图像和坐标系统一致但不重合_学习ArcGIS,这62个Arcmap常用操作技巧可能帮到您...
  8. 林轩田 《机器学习基石》学习笔记
  9. 使用帧相似度匹配编写无缝循环视频截取工具
  10. 程序员为什么一定要学好数学?驻足听一下“老人言”
  11. python祝福语_Python | 微信自动回复祝福语
  12. 01.什么是数学建模
  13. 关于extjs中的cls ≠ class
  14. preceding-sibling::*[1]
  15. 0906期最新上市——“架构师大阅兵”
  16. 李开复:中国创业失败率高因天使投资人太少
  17. ginapi服务器性能,基于gin web框架搭建RESTful API服务
  18. 九龙擒庄指标源码破译_妖股出世爆发点公式?九龙擒庄指标源码破译!
  19. 关于显卡copy占用来回跳动解决方法
  20. catia怎样倒2d_Catia Drafting平面图生成 3D 转2D教程.ppt

热门文章

  1. 阅读方法论看书的乐趣
  2. video-js 删除视频列表中的某个视频后,重复初始化不成功问题(通过ID初始化)
  3. matlab 折线束的包络,用matlab绘制图1中右图的圆、折线束及其包络线(心形线),请给出步骤及其实现原理,...
  4. andriod 如何设计圆形头像
  5. 不用出镜,每天日入300左右,做自媒体推荐做这5个领域
  6. DeFi之道丨圣路易斯联储万字科普DeFi:金融业的范式转变
  7. 点在不规则图形内算法python_判断某个点是否在不规则图形内
  8. 《阅读-拖延心理学》
  9. 帮我列举下医疗器械行业的公司,要最厉害的。
  10. 冷却水的循环方式有哪几种_循环冷却水系统,按照通风方式可分为 和 两种。...