数据可视化技术可借助人脑的视觉思维能力,帮助人们理解大量的数据信息,发现数据中隐含的规律,从而提高数据的使用效率。面对大数据深奥的面貌,如何才能让大型数据集变得亲切和易于理解,可视化无疑是最有效的途径。对大数据背景下的数据可视化应用展开研究,将有助于我们发展和创新数据可视化技术。

  大数据时代的机遇与挑战

  物联网、云计算、移动互联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。随着社交网络的普及,使得人们的行为和情绪的细节化测量成为可能。挖掘用户的行为习惯和喜好,凌乱纷繁的数据背后找到更符合用户兴趣和习惯的产品和服务,并对产品和服务进行针对性地调整和优化,这就是大数据的价值。大数据也日益显现出对各个行业的推进力。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

 数据可视化技术及主要特点

  数据可视化(Data Visual)技术是指运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。它能够提供多种同时进行数据分析的图形方法,反映信息模式、数据关联或趋势,帮助决策者直观地观察和分析数据,实现人与数据之间直接的信息传递,从而发现隐含在数据中的规律。数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元元素来表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。

数据可视化技术的主要特点是:

  (1)交互性,用户可以方便地以交互的方式管理和开发数据;

  (2)多维性,可以看到表示对象或事件的数据的多个属性或变量,而数据可以按其每一堆的值,将其分类、排序、组合和显示;

  (3)可视性,数据可以用图像、曲线、二维图形、三维体和动画来显示,并可对其模式和相互关系进行可视化分析。

  基于Web的数据可视化的参考模型

  基于Web的数据可视化主要有以下四种参考模型

  (1)在服务器端生成描述数据的图形,然后在客户端实现图形的显示,客户端用浏览器来显示;

  (2)服务器端经过可视化映射后,输出VRML(Virtual Reality Modeling Language,简称VRML)成Java3D格式的3D模型,返回给客户,客户端利用支持VRML或Java3D的浏览器来绘制和操纵3D模型,这种方式的交互局限于绘制阶段;

  (3)客户下载数据,在客户端执行可视化流水线,利用JavaApplet实现可视化计算,客户还可以下载可视化软件。虽然客户端可以完全控制可视化过程,但对客户端的硬件、软件资源要求高,并且对大规模过程的控制;

  (4)服务器端以HTMLForms或JavaApplet方式提供可视化控制页面,浏览器客户下载控制页面,实现对可视化过程的控制。

  模型2和模型3需要针对具体的应用编制Java绘图程序,模型4采用了复杂的可视化计算在服务器端处理,避免了客户端较高的资源要求,同时客户端又能完成可视化结果的交互绘制,具有较好的交互性以及计算负荷分摊的优点,但同样编制程序复杂。而模型1使用Tee Chart Pro AetiveX控件,可以直接安装在服务器端,在服务器端动态生成图形文件(JPEG格式),然后将图形传回客户端,在浏览器中显示出来,方法可以适用于任何流行的客户端浏览器。

大数据的Web数据可视化方法流程

① 发现问题

  数据可视化都是为了解决某个问题的。所以,面对海量的数据,首先要思考如何针对领域问题合理抽取对应的数据。为创建信息可视化而提出问题时,我们应该尽可能地关注以数据为中心的问题。那些以“在哪里”、“什么时间”“有多少”或者“有多频繁”开头的问题通常是不错的开始,这些问题使我们专注于在特定的参数集合内查找数据,因此更有可能找到适用于可视化的数据。而对于以“为什么”开头的问题则要格外小心,它意味着你对数据的较为正式的描述开始转入改写数据分析。

②收集数据

  数据的收集和整理则是数据可视化的重中之重。然而准确地找到所需要的数据是一个非常困难的任务。通常,最好从已经可用的数据着手并尽量找到一种方式来描绘它,而不是尝试自己去收集数据。得到原始数据之后.则要着手于数据的解析、组织、分组或者修改,对数据进行再加工。

③ 选择一种可视化方式展现数据

  在明确想要展现的内容后,就要综合运用视觉元素的造型,色彩的选取,动态等赋予图表更好的视觉体验。数据可视化的过程要始终围绕着数据可视化的核心目标:帮助读者更好更准确的理解数据。web常见的的可视化有:地图、时间轴、网络图、树状图、矩阵图、散点图、气泡图、流程图、折线图、标签云、数据表、雷达图、热力图、平行坐标轴等等。

 大数据的Web数据可视化展现方式

①尺寸:这是最常用的可视化展现方式。当辨别两个对象时,我们可以通过尺寸对比快速地区分它们。此外,使用尺寸可以加快理解两组不熟悉的数字之间的区别。如百度统计,这个应用指在通过对网站流量的专业分析,帮助用户不断从网站流量数据中挖掘有价值的信息,指导网站运营。如这个网页目录的访客数统计图,采用了气泡面积的可视化展现方式,通过气泡尺寸面积对比,直观的展现出各网页目录的访客数多少。

②色彩:色彩是展现大数据集的一种优秀方式,我们可以通过色彩识别出很多层次和色调。这一点使得色彩成为展现宏观趋势的必然选择。运用色彩进行可视化创作时要特别注意的是要确保读者能够区分出在45%和55%的数据点。

③位置:基于位置的展现方式就是把数据和某些类型的地图关联起来,或者把它和一个真实或虚拟地方相关的可视化元素进行关联。

④网络:网络展现方式显示了数据点之间的二元连接,在查看这些数据点之间的关系时很有帮助,在线网络可视化在视交网站中已十分广泛的应用了,如QQ上有个应用,你可以通过人脉关系图查看自己的人际网络。

⑤时间:随时间变化的数据通常是根据时间轴进行描绘。众多的表现形式需要通过各种各样的手段来呈现,在计算机上主要通过程序算法来实现。设计师在选择表现形式的同时一定要考虑到受众是否能够很好的去接受和吸收信息,设计师需要了解视觉心理对用户浏览时的影响。随着互联网的发展,今后数据可视化还会发展出许多新的形式和特点来帮助人们理解数据、驾驭数据。

  总结

  数据可视化通过图像、图形技术对数据进行形象化处理,通过信息技术对数据进行准确、实时、自动化的高度透明的处理。在实际项目中,将大量的数据以图形人的方式在Web页面上展现出来,有助于分析数据,揭示数据内部规律。随着计算机图形学、多媒体技术、人机交互技术及各应用领域的需要,数据可视化将会有更加广阔的发展空间。

  来源:论文网 原文地址:http://www.xzbu.com/8/view-4852538.htm

浅谈大数据时代web数据可视化探析相关推荐

  1. 大数据审计的发展_浅谈大数据时代下审计工作的发展方向

    浅谈大数据时代下审计工作的发展方向 李寒梅 [摘 要] [ 摘 要 ] 随着信息化水平不断提升,企业的审计工作需要处理海量的数 据,而利用常规软件难以对海量数据进行处理,这就需要应用大数据技术.审 计 ...

  2. 浅谈大数据的标签管理

    最近参与了一个大数据的项目,是涉及标签管理方面的内容,使我这个初涉入大数据领域的人获益匪浅. 标签,也可以叫做Tag,最早出现于2005年(注1),随着Web2.0的Blog应用被广泛使用开来.标签也 ...

  3. 张晓波:浅谈大数据应用的知与行|V课堂第82期

    2017年8月26日,<中国大数据应用蓝皮书>的发布引起了大数据领域的政产学界领导.顶尖学者的强烈关注.在全球化的新阶段,面对互联的新世界,大数据如何不断创造新模式.新生态和新时代? 第8 ...

  4. 浅谈大数据:如何成为大数据企业?

    文章讲的是 浅谈大数据:如何成为大数据企业, 1.什么叫大数据? "大数据"是"数据化"趋势下的必然产物!数据化最核心的理念是:"一切都被记录,一切都 ...

  5. 嵌入式AI —— 6. 为糖葫芦加糖,浅谈深度学习中的数据增广

    没有读过本系列前几期文章的朋友,需要先回顾下已发表的文章: 开篇大吉 集成AI模块到系统中 模型的部署 CMSIS-NN介绍 从穿糖葫芦到织深度神经网络 又和大家见面了,上次本程序猿介绍了CMSIS- ...

  6. oracle全表扫过程讲解,CSS_浅谈存取Oracle当中扫描数据的方法,1) 全表扫描(Full Table Scans, FTS) - phpStudy...

    浅谈存取Oracle当中扫描数据的方法 1) 全表扫描(Full Table Scans, FTS) 为实现全表扫描,Oracle读取表中所有的行,并检查每一行是否满足语句的WHERE限制条件一个多块 ...

  7. [转] 浅谈脱壳中的附加数据问题(overlay)

    浅谈脱壳中的附加数据问题(overlay) Author:Lenus From: www.popbase.net E-mail:Lenus_M@163.com -------------------- ...

  8. 浅谈脱壳中的附加数据问题(overlay)

    浅谈脱壳中的附加数据问题(overlay) Author:Lenus From: www.popbase.net E-mail:Lenus_M@163.com -------------------- ...

  9. python读取图像数据流_浅谈TensorFlow中读取图像数据的三种方式

    本文面对三种常常遇到的情况,总结三种读取数据的方式,分别用于处理单张图片.大量图片,和TFRecorder读取方式.并且还补充了功能相近的tf函数. 1.处理单张图片 我们训练完模型之后,常常要用图片 ...

  10. 【2016年第3期】大数据时代的数据科学家培养

    朱扬勇1,2,熊贇1,2 1.复旦大学计算机科学技术学院,上海  200433:2.上海市数据科学重点实验室,上海  200433 摘要:大数据时代,最热门的职业是数据科学家(data scienti ...

最新文章

  1. opencv java 灰度_如何使用Java将图像转换为灰度?
  2. Error in install.packages : cannot remove prior installation of package
  3. Android NDK 使用自己的共享库(Import Module)
  4. spss相关性分析看结果_利用spss做Pearson相关性分析步骤详解
  5. hihoCoder#1037 : 数字三角形(DP)
  6. C#把TextBox.Text的几万条数据按数据格式导出Excel报错:Insufficient memory to continue the execution of the program.
  7. 华为手机如何关闭通知栏推送消息_如果华为手机升级EMUI10后,电池耗电很快!要记得调整这3个设置...
  8. 计算机工具软件应用考试,《计算机常用工具软件》期中考试题
  9. 记一次 .NET 车联网云端服务 CPU爆高分析
  10. Intel硬件加速 VS CUDA完胜 视频转码感受
  11. 关于 C 的 arithmetic conversion (进行 算术运算 时的 强制转换规则)
  12. Linux内核学习笔记(2)-- 父进程和子进程及它们的访问方法
  13. win11提示无法安装程序包时该怎么办
  14. c# 类似Excel的趋势线拟合
  15. Python进行高斯积分(Gaussian integral)
  16. 库存数量控制中储备定额方法的改进与实现
  17. Android手机减少微信步数,iPhone微信步数竟然比安卓少很多,原因已明确!
  18. Jmeter - JMeter监听器 -上篇(详解教程)
  19. c语言去掉文件中重复单词,awk脚本 使用awk去掉重复的单词
  20. void func()与 func(void)的区别

热门文章

  1. 时间日期插件引用使用方法
  2. 【错误记录】Kotlin 报错 ( Some kotlin libraries attached to this project were compiled with a newer kotlin )
  3. 2020.3-4 【读书笔记】
  4. 【前端框架】Element UI Dialog 组件中执行 DOM 操作异常问题的分析与处理
  5. 2549. 删除他们! 解题报告
  6. ALSA驱动框架简介
  7. Mycat安装与配置详解
  8. 坑爹的苹果机不执行ajax请求,苹果机加载外部Jquery失败
  9. mysql 增量 命令
  10. 使用Source Insight查看编辑源代码