大数据具有4V特征,即:体量巨大(volume)、类型繁多(variety)、时效性高(velocity)以及价值高密度低(value)。
大数据分析的理论和方法研究可以从两个维度展开:一是从机器或计算机的角度出发,强调机器的计算能力和人工智能,以各种高性能处理算法、智能搜索与挖掘算法等为主要研究内容,例如基于 Hadoop 和 MapReduce 框架的大数据处理方法以及各类面向大数据的机器学习和数据挖掘方法等,这也是目前大数据分析领域的研究主流;另一个维度从人作为分析主体和需求主体的角度出发,强调基于人机交互的、符合人的认知规律的分析方法,意图将人所具备的、机器并不擅长的认知能力融入分析过程中,这一研究分支以大数据可视分析。
未来的十大挑战主要聚焦于可视分析领域所关注的核心主题:认知、可视化、人机交互的深度融合。
可视分析是一种通过交互式可视化界面来辅助用户对大规模复杂数据集进行分析推理的科学与技术。
大数据可视分析是指在大数据自动分析挖掘方法的同时,利用支持信息可视化的用户界面以及支持分析过程的人机交互方式与技术,有效融合计算机的计算能力和人的认知能力,以获得对于大规模复杂数据集的洞察力(insight).
根据信息的特征把信息可视化技术分为一维信息(1-dimensional)、二维信息(2dimensional)、三维信息(3-dimensional)、多维信息(multidimensional)、层次信息(tree)、网络信息(network)、时序信息(temporal)可视化。
文本可视化:
文本信息是大数据时代非结构化数据类型的典型代表,文本可视化的意义在于,能够将文本中蕴含的语义特征(例如词频与重要度、逻辑结构、主题聚类、动态演化规律等)直观地展示出来。典型的文本可视化技术是标签云(word clouds 或 tag clouds),将关键词根据词频或其他规则进行排序,按照一定规律进行布局排列,用大小、颜色、字体等图形属性对关键词进行可视化.目前,大多用字体大小代表该关键词的重要性,在互联网应用中,多用于快速识别网络媒体的主题热度.当关键词数量规模不断增大时,若不设置阈值,将出现布局密集和重叠覆盖问题,此时需提供交互接口允许用户对关键词进行操作,例如 ManiWordle。
如何将动态变化的文本中时间相关的模式与规律进行可视化展示,是文本可视化的重要内容.引入时间轴是一类主要方法,ThemeRiver用河流作为隐喻,河流从左至右的流淌代表时间序列,将文本中的主题按照不同的颜色的色带表示,主题的频度以色带的宽窄表示.基于河流隐喻,研究者又提出了== TextFlow进一步展示了主题的合并和分支关系以及演变. EventRiver==,其中将新闻进行了聚类,并以气泡的形式展示出来。
网络(图)可视化:
经典的基于节点和边的可视化,是图可视化的主要形式,空间填充法也是常采用的可视化方法,因此面临大数据中的图,需要对这些方法进行改进,例如计算并行化、图聚簇简化可视化、多尺度交互等。
图简化(graph simplification)方法是处理此类大规模图可视化的主要手段: 一类简化是对边进行聚集处理,例如基于边捆绑(edge bundling)的方法。另一类简化是通过层次聚类与多尺度交互,将大规模图转化为层次化树结构,并通过多尺度交互来对不同层次的图进行可视化.。动态网络可视化的关键是如何将时间属性与图进行融合,基本的方法是引入时间轴。
时空数据可视化:
时空数据是指带有地理位置与时间标签的数据,大数据环境下时空数据的高维性、实时性等特点,也是时空数据可视化的重点.。流式地图 Flow map是一种典型的方法,将时间事件流与地图进行融合,为了突破二维平面的局限性,另一类主要方法称为时空立方体(space-time cube),以三维方式对时间、空间及事件直观展现出来。
多维数据可视化:
多维数据指的是具有多个维度属性的数据变量,多维可视化的基本方法,包括基于几何图形、基于图标、基于像素、基于层次结构、基于图结构以及混合方法.其中,基于几何图形的多维可视化方法是近年来主要的研究方向.大数据背景下,除了数据项规模扩张带来的挑战,高维所引起的问题也是研究的重点。
散点图(scatter plot)是最为常用的多维可视化方法,三维空间,通过可旋转的 Scatter plot 方块(dice)扩展了可映射维度的数目,==投影(projection)==是能够同时展示多维的可视化方法之一,==平行坐标(parallel coordinates)==是研究和应用最为广泛的一种多维可视化技术,平行坐标散点图 PCP(parallel coordinate plots)。

信息可视化中的人机交互技术主要可概括为5 类:动态过滤技术(dynamic queries)与动态过滤用户界面、整体+详细技术(overview+detail)与 Overview+Detail 用户界面、平移+缩放技术(panning+zooming)与可缩放用户界面(ZUI)、焦点+上下文技术(focus+context)与 Focus+ Context 用户界面、多视图关联协调技术(multiple coordinated views)与关联多视图用户界面。

读文献“大数据可视分析综述”相关推荐

  1. 《大数据》专题征文:大数据可视分析技术与应用

    点击上方蓝字关注我们 <大数据>专题征文:大数据可视分析技术与应用 (截稿时间:2020年12月31日) 随着信息技术的飞速发展,特别是网络的普及,人类产生的数据量呈现爆炸式增长.而可视化 ...

  2. 专题导读:大数据可视分析应用

    点击上方蓝字关注我们 可视化是数据科学的重要组成部分.可视化把数据转化为可以交互的图形图像,能够帮助用户更好地理解.分析复杂的数据对象,而可视分析则通过紧密耦合可视化交互界面与自动计算,大大提高人类发 ...

  3. 大数据可视分析在海洋领域的应用

    点击上方蓝字关注我们 大数据可视分析在海洋领域的应用 解翠1, 李明悝2, 陈萍1, 李孝天1, 宋键1, 董军宇1, 赵佳萌1 1 中国海洋大学信息科学与工程学院,山东 青岛 266100 2 中国 ...

  4. 一文读懂大数据漏斗分析!

      下面我将为您介绍漏斗分析的概念,以及组织及其数据如何使用它来分析大数据集.希望能够帮到你们. 很多时候我们发现我们的业务数据看起来很不错,但最终的转换量却很低,这就说明业务转换率这里有问题.而在数 ...

  5. 干货分享:大数据可视决策关键技术有哪些?分析篇

    一.什么是数据可视化 俗语有曰:文不如表,表不如图.数据可视化就是借助于图形化手段,把最基本的数据进行处理.运算之后,通过可视化技术,深度挖掘.呈现背后深层次的指标.规律,并结合不同行业业务需求,清晰 ...

  6. 熟练掌握R语言的Meta分析全流程和不确定性分析,并结合机器学习等方法讲解Meta分析在文献大数据的延伸应用

    Meta分析是针对某一科研问题,根据明确的搜索策略.选择筛选文献标准.采用严格的评价方法,对来源不同的研究成果进行收集.合并及定量统计分析的方法,最早出现于"循证医学",现已广泛应 ...

  7. 《文本大数据情感分析》读书报告

    <文本大数据情感分析>(高凯 徐华 王九硕 岳重阳 高成亮著)一书介绍社交网络等海量异构信息采集算法:对文本挖掘与自然语言处理中涉及到情感分析.微博情绪诱因分析.电商产品评价与意见挖掘等内 ...

  8. 【2017年第1期】手机基站定位数据可视分析

    李海生1,2,黄媛洁1,2,宋璇1,2,杜军平3,陈国润4,丁富强4 1 北京工商大学计算机与信息工程学院,北京 1000482 食品安全大数据技术北京市重点实验室,北京 1000483 北京邮电大学 ...

  9. 足球比赛数据可视分析

    点击上方蓝字关注我们 足球比赛数据可视分析 曹安琪1,2, 陈泓宇2, 谢潇2, 巫英才1,2 1 之江实验室,浙江 杭州 310012 2 浙江大学计算机辅助设计与图形学国家重点实验室,浙江 杭州 ...

最新文章

  1. github 思维导图开元软件_画思维导图记笔记的工具软件
  2. vm虚拟机linux磁盘空间不足,手动扩大
  3. Python 库升级问题-module ‘requests.exceptions‘ has no attribute ‘ReadTimeout‘原因及解决办法
  4. 一文搞定Linux shell脚本编程( 史上最全汇总 )
  5. 数据库有哪些设计技巧
  6. Android之用jadx进行反编译
  7. linux c截断文件
  8. Unity4.6证书激活问题
  9. Kubernetes 是一个“数据库”吗?
  10. LeetCode-Largest Rectangle in Histogram
  11. 猫眼top前100电影爬取demo(正则初试)
  12. 使用原生XMLHttpRequest对象演示ajax(Ajax)功能
  13. asp.net---jquery--ajax 实现滚动条滚动到底部分页显示
  14. 不确定度在线计算_国睿认证干货来啦:实验室CNAS认可常见问题集锦(五):关于不确定度...
  15. require smarty.class.php 报错,Smarty 报错
  16. TDA4 制作 SD卡驱动
  17. Python:常见排列组合问题处理
  18. Servlet学习记录2
  19. 2012年真的是世界末日吗?_全球关注
  20. 如何查看自己的淘宝号使用多久了,淘龄怎么查?

热门文章

  1. Libtorch的介绍与使用方法
  2. 远程教育英语计算机统考试题,2020年远程网络教育计算机应用基础统考题库原题真题(完整版)...
  3. php class ziparchive not found,php Class 'ZipArchive' not found解决办法(php安装zip扩展)
  4. python数学建模--数据拟合
  5. 海思芯片关于显示信息的调试及查看-HDMI信息
  6. 电脑为啥老是黑屏?只因为你不知道这9种方法
  7. 基于光纤通信复用技术的毕业设计
  8. [TJOI2007]路标设置题解
  9. 刻录车载CD音乐光盘的历程
  10. java正则表达式语法