可视化是获取并分享观点的绝佳途径,但很多大数据团队却没能选对正确的方式。可视化怎么会出现问题?原因很简单,因为存在多种可能破坏数据可视化效果的实施方式。下面我们就一同来探讨最为常见的三种错误实践。

  错误一:显示所有数据

  尽管我们在学校里被告知表达意见应当尽全面,但事实上大多数人根本不在乎我们实际做过多少工作,他们不关心我们每天处理了多少数据或者Hadoop集群的规模到底有多大。客户与内部用户需要的是具体且紧紧围绕核心问题的答案,而且最好能让他们尽早得到这些答案。我们的答案与他们的需求关联越是紧密,他们在寻找答案方面所投入的精力也就越少。请千万记住,页面上显示的无关数据越多、找出正确结论与相关信息就变得越困难;无论出于什么样的理由,无关数据就是分散注意力、浪费时间资源的干扰因素。

  这类干扰因素在信息面板当中显得特别普遍,因为这类面板的指导理念往往是“显示所有状态”。但事实上其中大部分状态都是正常、乏味、甚至不值一提的,因此把这些没问题的内容显示出来很可能导致相关人员因为视觉疲劳而忽略了真正异常的状况。

  出色的信息面板方案应该只显示那些值得关注或者重要性较高的内容。优先显示重要信息、而后是意外信息、接下来是可操作性信息,其它内容则都应该尽可能淡化。深入挖掘数据信息当然也很重要,不过信息面板并不是处理这项工作的舞台。对于信息挖掘工作,报告等包含广泛非可操作性数据的表达载体更为适合。

  错误二:信息关联性不好、复杂性过高

  这种错误的危险性绝不逊于第一条。显示全部信息子集当然不错,但前提是数据的关联性必须得到保证。举例来说,如果大家关注销售情况,那么同时也可能希望了解各个地区的销售走势或者其随时间推移而发生的变化。首先考虑到用户对数据的使用方式,而后才能作出正确决策。

  将所有信息都塞进同一套图表当中很可能不足以概括整体情况,相比之下制作多份紧密关联的图表才是最理想的处理方式。一般来说,多份简洁而清晰的图表在实际表现方面要优于单一且高度复杂的数据可视化成果。

  错误三:糟糕的数据表现形式

  即使我们在绘制图形时使用的数据完全正确,得到的结果也仍然无法保证有效。结合实际体验,大家会发现日常工作中很少见到某些奇特的图形设计——这是因为它们的效果并不好。在满足可视化需求方面,绝大部分优秀的案例都会相对保守地使用样形图、折线图、散点图以及饼状图(其中饼状图的制作难度更大一些)。

  我们需要思考不同数据字段之间的核心关联,并想办法将这些字段铺设在坐标轴之上。接下来,按照类型进行分组,并以时间、幅度或者重要性为依据对数据加以排序。(如果这些排序方式都不合适,按照首字母或者拼音排序也是可行的。)另外,请务必用颜色来标记不同类别(而不要用大小);大家可以利用不同亮度或者色彩饱和程度来说明大小。再有,请使用标签及其它标记有选择地引导阅读者的注意力,同时又不至于扰乱正常查看。

  为了避免失误,最好的方法是专注于你的目标。在可视化应用之前就应该考虑:我们关心什么?需要做什么?要解决什么问题?要看到怎样的数据?以怎样的结构和关系来展示?要突出哪些数据?当你能够回答这些问题时,你就可以进行数据可视化的设计或者应用了。

大数据可视化要避免的常见错误相关推荐

  1. 大数据可视化常见的三种错误

    可视化是获取并分享观点的绝佳途径,但很多大数据团队却没能选对正确的方式.可视化怎么会出现问题?原因很简单,因为存在多种可能破坏数据可视化效果的实施方式.下面我们就一同来探讨最为常见的三种错误实践. 错 ...

  2. 大数据技术人员工具包之—常见数据挖掘分析处理工具

    大数据技术人员工具包之-常见数据挖掘分析处理工具 2016年03月15日 大数据 数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学.概率模型.统计学.机器学习.数据仓库.可视化等.在 ...

  3. 数据可视化-echarts入门、常见图表案例、超详细配置解析及项目案例

    文章目录 数据可视化-echarts入门.常见图表案例及项目案例 一.简介 一.数据可视化简介 二.echarts简介 三.echarts特点 四.ZRender介绍 二.Echarts的基本使用 一 ...

  4. 基于hadoop和echarts的教育大数据可视化系统 毕设完整的代码+数据集

    一.摘 要 在线教育平台现在是教育体系的重要组成部分,在当前大数据时代的背景下,促进教育机构建立统一平台.统一资源管理的数字化教学系统.如何评估系统平台的健康程度.学生的学习体验和在线课程的质量对于课 ...

  5. Hadoop+hive+flask+echarts大数据可视化项目之flask结合echarts前后端结合显示hive分析结果

    Hadoop+hive+flask+echarts大数据可视化项目(五) ------flask与echarts前后端结合显示hive分析结果------- 关注过Hadoop+hive+flask+ ...

  6. 大数据可视化技术面临的挑战及应对措施

    来源:科技导报 本文约5400字,建议阅读10分钟 本文介绍了适用于大数据的数据可视化技术,讨论了针对大数据可视化应用需求自主研发的交互式可视化设计平台AutoVis及其应用. [ 导读 ]本文从大数 ...

  7. python 3d大数据可视化软件_十大顶级大数据可视化工具推荐

    要使数据分析真正有价值和有洞察力,就需要高质量的可视化工具.市场上有很多产品,特点和价格各不相同,本文列出了一些广泛认可的工具.其实企业如何选择一个合适的可视化工具,并不是一件容易的事情,需要仔细的考 ...

  8. 大数据 挑战 机会_大数据可视化面临哪些挑战

    数据可视化在大数据场景下面临诸多新的挑战,包括数据规模.数据融合.图表绘制效率.图表表达能力.系统可扩展性.快速构建能力.数据分析与数据交互等. 数据规模 大数据规模大.价值密度降低,受限于屏幕空间, ...

  9. 玩转大数据可视化,推荐几个必学的工具

    如今,企业越来越重视数据分析给业务决策带来的有效应用,而可视化是数据分析结果呈现的重要步骤.而可视化技术/工具在国内国外也发展的相当成熟,很多都已经做成应用(比如可视化图表库,BI工具等等),并投入商 ...

最新文章

  1. Nginx HttpMemcModule和直接访问memcached效率对比测试
  2. php+ tinymce粘贴word
  3. 160个Crackme019
  4. 全球及中国散热市场应用格局与竞争态势研究报告2022-2027年
  5. java并发编程之美-阅读记录4
  6. OGRE 学习小记 开发环境的配置
  7. java使用jeids实现redis2.6的list操作(4)
  8. WSDM 2022 | 合约广告自适应统一分配框架
  9. 仅此一文让你明白事务隔离级别、脏读、不可重复读、幻读
  10. Android okHttp网络请求之缓存控制Cache-Control
  11. java expression 强制出现_Java中带有强制括号对的单行循环
  12. 老翟书摘:《丰田生产方式》
  13. 我没有时间 I Don't Have Time?
  14. 运用极域电子教室控制其他学生端(不需要教师端)
  15. pygame.mask原理及使用pygame.mask实现精准碰撞检测
  16. c语言 位运算和位运算符
  17. CTF-MD5之守株待兔,你需要找到和系统锁匹配的钥匙 WP
  18. 基于Java(SSH 框架)+MySQL 实现的物流配送管理系统【100010488】
  19. Restlet restful 学习
  20. 人工神经网络导论_神经网络导论

热门文章

  1. pl/sql 设置编码
  2. opipe--一款基于java的自定义“命令”管道
  3. 【To Understand! 重点 递归 动态规划 正则表达式匹配】LeetCode 44. Wildcard Matching
  4. 【细节实现题】LeetCode 8. String to Integer (atoi)
  5. 【LeetCode 148】链表的归并排序
  6. Qt窗口操作函数(最大化,全屏,隐藏最大化,最小化)
  7. JavaScriptJQ 004_JS闭包
  8. 简记MobileNet系列
  9. 读书笔记-《JavaScript高级程序设计》-第2章 在HTML中使用JavaScript
  10. 统计学习方法c++实现之二 k近邻法