可视化,被视为大数据落地的最后一公里。就如同人们去商场购物时,看见一件漂亮的衣服,但2000元略贵的标价或许会让部分用户产生犹豫,而可视化充当的作用就相当于给这件衣服贴上了打8折的标签,为最后的决策提供了助力。

在大数据领域,重要的是数据本身以及从中得到的价值,但同时可视化的推动作用,为不同年纪、不同职责的用户采用大数据提供了更好的体验,降低了认知的壁垒。

商业决策离不开互动性的可视化

目前的大数据可视化呈现,大多数以表格、饼图等方式展示,例如用户比较熟悉的支付宝用户的全年消费记录。虽然类似的可视化提供了直观的数据感受,但另一方面,不得不说其呈现的数据信息量有限,内容较为死板,特别是在商业上,难以提供更多的价值或知识。在硅谷领先大数据公司Taste Analytics数据可视化副总裁俞立看来,数据可视化不仅需要提供直观、形象的体验,同时还应该包含重点信息提取、可追踪,以及人机互动性增强两个方面。

“在商业决策上,企业需要的大数据可视化不仅是一张张大致方向上的图表,同时需要在这些图表上进行任意维度的选择,对真正重要、感兴趣的信息进行查找、追踪。”他表示,在最终数据呈现上,现在的可视化大多停留在数据包含哪些场景和要素领域,而对数据中最重要的人事物、数据发送时间地点、用户讨论这些场景与要素的位置等细节却无从追踪,所以企业难以得到更多的知识。

此外,目前国内大多数非结构数据分析产品,包括关键词提取、情感分析、舆情模型分析等,常常采用预先定义文档标签和关键词,来进行分类, 需要人工大量干预。“业界比较前沿的做法,是机器通过一定的规则进行文档自动分类。例如Taste Analytics的Signals平台不用定义标签,借助系统后台的焦点提取功能,通过机器学习和统计归类的方法,自动地提取出数据的分类模型,同时从语义方向分析这些数据。” 俞立,这位在学生时代便一直研究大规模时变数据可视化的博士表示,这类做法的优势在于,不仅人工干预少,可以更智能、客观地分析趋势;并且对于数据科学家等用户,可以在此基础上对分析结果进行调整,加入更多的参数或信息,机器便能重新学习并处理数据,呈现出一个更加准确的结果。
**
结构化与非结构化数据融合分析**

最终可视化结果的准确性与数据分析过程紧密相关。时下,越来越多的企业开始通过第三方平台,或服务外包来实现大数据分析,例如采用Salesforce、Answers Forsee等平台,或借助国内一些厂商的类似服务。尽管提供大数据分析服务的公司不少,但现有产品仍是以结构化数据分析为主,少量非结构化分析产品也是针对语义分析、情感分析、舆论分析等提供单一功能,很少将结构化数据和非结构化数据结合形成一套整体解决方案。

“现在Taste Analytics已可以同时实现结构化数据分析和非结构化数据分析。” 俞立表示。

例如大众点评中用户对万达影城的评论中,详细的语言评论是非结构化数据,环境、服务、视觉效果等评分是结构化数据。Taste Analytics平台将详细语言评论进行自动归类及焦点提取,分析出时间、地点、人物,以及语义焦点(最重要的词语,如负面评价、正面评价);同时在环境、服务、视觉效果评分等结构化数据导入系统后,可以得到具体城市如北京万达影城的环境、服务、视觉效果态度分布,以及基于这个分布用户的评论信息的关键词。通过“结构化数据+非结构化数据”下更多维度的分析,可以得出哪些焦点比较突出,用户为什么给出5分好评或2分差评。

所以这样结构化数据与非结构化数据分析的结合,可以带来更多深入的分析,在可视化呈现上,也不仅能表达出其他数据分析产品展示的“是什么”,同时还能表达出“为什么”。

可视化应同时服务两类用户

“从用户角度看,大数据分析应该越傻越好,越简单越好,人工干预越少越好。”Taste Analytics移动技术总监沈於众说道,尽管如此,但实际上大数据分析产品应该面向不同类型的用户,例如对于数据科学家、分析师,其可能需要更多的观察或与数据间的互动;而对于企业CEO、产品经理等,其需要最终呈现的信息能直击企业痛点,越重要越好。所以Taste Analytics的可视化便是同时服务这两类人群,专业的数据分析师、科学家,以及对数据分析“业余”的决策层人士。

另一方面,在可视化技术实现上,采用SVG和HTML 5已经成为业界事实上的规范。

拥有10年框架设计经验的沈於众表示,现在Taste Analytics的产品便是基于Facebook提出的最新的React.js,通过自己的内部延展而形成高性能、高互动性的实现,“通过统一的人机互动设计、精简的图像可视化阵线,我们Signals平台把复杂的数据分析过程简易化。尤其是当我们的用户可以在平板电脑、手机、PC、笔记本等终端上,以相近的用户体验来随时分析数据时,我们的平台极大程度地提升了客户的数据分析能力和理解能力。”

“我们选择了各种美国先进的网络设计语言,同时编写出了一套自己的优化体系。Signals在最终平台上呈现的效果也算业界领先,所以最终数据可视化的效果、页面相应速度、内存上的优化,在同行里也优势突出。” 沈於众解释道。

目前,Signals平台能够为用户提供10余种图像可视化模式,并且支持客户自定义分析,共包括15种不同的可视化分类。

本文转自d1net(转载)

互动性可视化,打通大数据最后一公里相关推荐

  1. 互动性可视化 打通大数据最后一公里

    ZD至顶网CIO与应用频道 03月09日 北京消息:可视化,被视为大数据落地的最后一公里.就如同人们去商场购物时,看见一件漂亮的衣服,但2000元略贵的标价或许会让部分用户产生犹豫,而可视化充当的作用 ...

  2. 消除数据信息碎片化 打通大数据应用“最后一公里”

    大数据.人工智能和人类智慧,成为智能数据时代的三大要素.数据的积累,可以为人类提供更多更细的洞察分析,人类经验得以增强,人类智慧得以增长. 消除数据信息碎片化 打通大数据应用"最后一公里&q ...

  3. 【爬虫+数据可视化毕业设计:英雄联盟数据爬取及可视化分析,python爬虫可视化/数据分析/大数据/大数据屏/数据挖掘/数据爬取,程序开发-哔哩哔哩】

    [爬虫+数据可视化毕业设计:英雄联盟数据爬取及可视化分析,python爬虫可视化/数据分析/大数据/大数据屏/数据挖掘/数据爬取,程序开发-哔哩哔哩] https://b23.tv/TIoy6hj

  4. 【【数据可视化毕业设计:差旅数据可视化分析,python爬虫可视化/数据分析/大数据/大数据屏/数据挖掘/数据爬取,程序开发-哔哩哔哩】-哔哩哔哩】 https://b23.tv/iTt30QG

    [[数据可视化毕业设计:差旅数据可视化分析,python爬虫可视化/数据分析/大数据/大数据屏/数据挖掘/数据爬取,程序开发-哔哩哔哩]-哔哩哔哩] https://b23.tv/iTt30QG ht ...

  5. 大数据最后一公里——2021年五大开源数据可视化BI方案对比

    个人非常喜欢这种说法,最后一公里不是说目标全部达成,而是把整个路程从头到尾走了一遍. 大数据在经过前几年的野蛮生长以后,开始与数据中台的概念一同向着更实际的方向落地.有人问,数据可视化是不是等同于数据 ...

  6. 数据可视化之大数据平台可视化

    一 前言 在简化数据量和降低大数据应用的复杂性中,大数据分析发挥着关键的作用.可视化是其中一个重要的途径,它能够帮助大数据获得完整的数据视图并挖掘数据的价值.大数据分析和可视化应该无缝连接,这样才能在 ...

  7. 数据可视化之大数据可视化

    一 前言 您需要一种方法来快速调整企业的工作方向,以应对世界和客户不断变化的期望. 您还需要一种手段以使用大数据快速做出这些业务决策. 但是大数据的数量一直在增加,变得越来越庞大. 因此,整理.理解和 ...

  8. 程序思路分享 计算机毕业设计Python+Spark+Hadoop+Flink微博舆情预警系统 微博舆情可视化 舆情大数据 微博大数据 微博爬虫 大数据毕业设计 大数据毕设

    开发技术 前端:vue.js echarts websocket 后端:springboot+mybaits 大数据计算框架:spark flink 机器学习/深度学习:lstm情感分析 爬虫:Pyt ...

  9. 解读至强的小秘密之 Analytics Zoo,打通大数据平台与 AI 应用的直通车

    人工智能(AI)的发展,离不开算力.算法和数据这个"铁三角"组合的驱动,它们之间的平衡发展,对 AI 技术的快速进步和实践落地起到了至关重要的作用.因此,在先进算法为 AI 应用提 ...

最新文章

  1. CS131-专题7:图像特征(SIFT算法)
  2. LeetCode(1.俩数之和)JAVA
  3. python路1---variable
  4. sola ris 简单命令
  5. Oracle后台进程
  6. 创建多级目录函数MakeSureDirectoryPathExists()所需头文件
  7. Spring Boot + Swagger
  8. Zookeeper 安装和配置---学习三
  9. [Leedcode][JAVA][第892题][图形题]
  10. 自制hdmi线一头改vga图_东莞VGA数据线厂商价格
  11. 开发者必备Linux命令
  12. python判断手机号码是否正确_Python实现随机生成手机号及正则验证手机号的方法...
  13. centos7-修改主机名
  14. xcap发包工具的简单使用3(报文描述)
  15. 浅层与深层、局部与全局、低级与高级特征的辨析
  16. 记录一下自己的春招,唯品会、360、京东offer已收、腾讯offer_call已达!!!
  17. Godaddy域名与腾讯云服务器ip绑定,使用域名访问
  18. 如何平衡工作与生活?真相在此
  19. (附源码)mysql+ssm学生选课系统 毕业设计 170920
  20. Java锁的种类以及辨析(四):可重入锁

热门文章

  1. 搭建外卖服务器系统,本地外卖系统如何更好的搭建
  2. 学霸们都在用的论文科研工具,接好了!
  3. 使用Java解决远程文件下载解决方案
  4. VarifocalNet: An IoU-aware Dense Object Detector
  5. STM32F103之实验6 采用MPU6050及DMP解算移动机器人姿态实验
  6. 古龙群侠传 服务器维护,古龙群侠传online-17173.com网络游戏
  7. 软件主管离职后非法获取海量客户信息牟利
  8. python入门(washer)
  9. python3.6 str.replace() 字符串替换方法
  10. 数据链路层功能,以太网帧格式,交换机工作原理和交换机的命令行配置