现在都说,是大数据时代,可是百度了,也不能给我一个通俗易懂的答案:到底什么是大数据,为什么会出现这种情况,怎么处理呢?

起初,数据量很少的时代,通过表格工具、mysql等关系型数据库(二维表数据库,数据逐行插入)就能够解决数据存储的问题。

但是,随着互联网的飞速发展,产品以及用户的激增,产生了海量的数据。

考虑到长足发展,公司会对产品、用户相关的原生数据、埋点数据等进行分析,传统的关系型数据库就无法满足需要,只能通过行式、分布式等数据库来存储这些数据(HBASE、hive等,能够实现集群化,及分配到多台主机上同时计算)。

当数据量大了,光秃秃的数字就难免让人产生困意,所以就出现了由数据向图表的转变,也就是我们说的数据可视化。

认识数据可视化

有了数据之后,对数据分析就是成了最关键的环节,我公司的分析师就曾对我说过一句话:数据分析主要对整体分析,而不执着于特殊的个体数据,这样才能够给产品提供宏观、有效的参考价值

海量的数据让用户通过逐条查看是不可行的,图像化才是有效的解决途径。少量的数据可以通过表格工具生成图表、透视表的方式进行分析,但是大数据的分析就需要借助专门的可视化工具了,常见的可视化工具包括:Tableau、FineBI等。

大部分商用数据可视化工具的计算、图表展示虽然比较强大,但是却无法做到实时数据快速生成,数据也多为push(固定的范围)的方式,有时候数据还需要二次加工满足可视化产品的规则(商用产品多考虑通用性,无法适用于所有企业的数据规范)。

除此之外,现在很多图表插件的开源化(如:Echart、GoogleChart),以及行业内对数据安全性等的考虑,越来越多的公司也开始进行数据可视化的私有化部署。

数据可视化的类型

1、探索性可视化

探索性可视化需求一般集中在数据分析场景中的数据探索场景。在分析数据的时候需要对数据进行探索,最后才能得出结论。

但是为啥我们需要使用可视化的方式去探索数据呢?使用统计学的方式不就能得出结论了吗?其实并不是,最典型的案例就是安斯库姆四重奏。四组数据的平均数、方差以及相关系数都一样,你可能会觉得这些数据的分布应该也会很像。

但,当你使用数据可视化的方式去看这些数据时,你会发现他们的分布都不一样:

从流程来看,探索性可视化是这样的:

2、解释性可视化

解释性可视化需求一般集中在完成了数据探索,并且形成一定数据洞察后的 story-telling 场景。大家在网上看到的一些「一张图搞懂 XXX 」、「一张图了解 XXX」就属于解释性可视化。所以解释性可视化的流程是这样的:

国内的可视化步骤一般是这样的:

用户导入数据到产品,然后进行一些可视化的探索,或者直接将数据进行可视化的表达。

但是,基于我对目前的用户样本量的理解,我发现这种偏业务型的产品框架,并不太适合国内市场。因为这类产品面向的用户基本上是专业用户(数据分析师),而忽略了一个事实——大部分中国企业并没有设立专门的数据分析岗位。

有能力配备数据分析师的企业一般都是中大型企业以及互联网企业,他们付费能力可能比较强,但是也意味着用户量会较少。用户样本集中在以下两大块:

专业用户对应的是数据分析师,而半专业用户则对应的是类似财务、销售、HR 等,在业务上专业但数据分析上不专业的用户。在企业里面,其实半专业用户远大于专业用户。而这类用户的日常工作又一般集中在解释性可视化上面,比如年终总结、年度规划、每月汇报中都需要利用到数据可视化。所以这类用户的流程是这样的:

用户导入数据,无需太复杂的操作,即可直接生成图表。(为什么少了数据化探索呢?其实是因为在半专业用户中,又以中小型企业的用户为主,他们的业务相对单一,且交易、财务数据都不会太大。当然了还有一些是靠 erp 数据分析的,这里就不展开细谈了。)

然后根据图表,补充自己的洞见,就可以制成报告给到老板。

数据可视化的实现

数据可视化产品(系统)的结构框架主要分为三层:数据存储层数据计算层数据展示层

1. 数据存储层

数据存储层在开头已经和大家说过了,在数据可视化产品(系统)中,既支持常规数据(MySQL、CSV等)可视化,也支持大数据(hive、HBASE等)的可视化,满足日常分析人员定性、定量的分析。

在考虑到数据安全的因素,数据存储还会与权限管理相结合,实现不同角色的人只能访问指定的数据。

2. 数据计算层

这里的计算不是平时所说的聚合、排序、分组等计算,解释之前我们先了解一下数据分析的工作流程吧:

  • 产品/运营人员提出数据需求,如“APP一周留存 ”;
  • 分析师确认需求后需要明确本次分析需要的字段及分析方式;
  • 数仓人员提供整理后的表格(数据模型,多张表join后合成的中间表);
  • 分析师基于数据模型进行可视化分析。

数仓提供的数据模型主要分为增量、全量数据,不能直接对某个较长范围的数据进行分析,举个例子1月1日、1月2日两天都产生了数据,增量、全量的数据存储方式效果如下:

3. 数据展示层

可以给很多人看,数据分析师,业务人员,IT人员,还有管理层。

总结

我想未来的 BI 的产品不能将自己定位为「工具」,而是应该定位为「服务」。

这里的「服务」不是说从原来的买断式收费,转变为按年收服务费,这只是商业模式的转变。我理解的转变是要从产品理念上做文章,BI 产品不能只是一个工具,而应该是一个服务平台,连接企业内外部数据之外,并且更重要的是,需要连接企业内外部的业务。比如连接供应链的数据,连接财务数据,连接审批数据等等。

比如,对于一家生产鱼丸的企业,当系统发现制作鱼丸的原材料库存不足,但是又快到销售的旺季,是不是能提前预警,并且快速将此信息发到供应商那,直接订货。再比如,当一家企业的现金流并不是非常健康时,系统能否能推荐企业一些「财务顾问」服务,甚至「现金贷款」服务?

我相信总归是有办法的。

互联网产品总监的经验总结:从0-1为你讲明白BI与数据可视化相关推荐

  1. 幕课网产品总监:教你从0到1打造600W下载量的爆款APP

    本期嘉宾:张国政,慕课网产品总监,前腾讯高级产品经理,目前主要负责慕课网APP产品线的整体战略规划.设计.产品团队组建. 首先介绍一下慕课网,简单来说就是一个IT技能学习或者在线教育平台,我们的定位也 ...

  2. 终于有人把Web 3.0和元宇宙讲明白了

    导读:元宇宙的终极形态势必是去中心化的,而现在的网络生态并不能完全满足元宇宙去中心化的需求.一些人认为,即将到来的Web 3.0时代和元宇宙需要的网络生态高度重合.Web 3.0或许能够成为人类迈向元 ...

  3. GPT4.0一句话实现各类图表制作,让数据可视化变得更简单!类图、流程图、ER图.....

    不知道大家有没有被ER建模工具复杂的操作按钮给困扰过.在作者学习ER建模时,曾希望能直接画出类图,但最终还是不得不学习繁琐的操作流程.然而,随着GPT的出现,AI现在也可以绘制UML图了!今天要向大家 ...

  4. 互联网产品设计进阶(11)产品设计师的职责

    产品经理或者产品设计师到底是一个什么样的角色?为了找到这个答案,先看看几个典型的招聘广告吧. 一.分析几则招聘广告 1.第一则产品经理招聘广告 1.根据公司的业务规划和特点,开发有质量的新业务,并制定 ...

  5. 产品设计——互联网产品设计

    产品设计有三种层次的水平:本能水平的设计,行为水平的设计和反思水平的设计. 本能水平的设计,涉及产品外形的初始效果; 行为水平的设计,用户使用产品的经验,约等于 用户体验; 反思水平的设计,包括产品给 ...

  6. 1【源码】数据可视化:基于 Echarts +Java SpringBoot 实现的动态实时大屏范例-互联网企业数据分析

    目录 效果展示 1.首先看动态效果图 2.再看实时分片数据图 一. 需求确认 1.确定产品上线部署的屏幕LED分辨率 2.功能模块 3.部署方式 二.整体架构设计 三.开发环境搭建 1.Java开发环 ...

  7. 【产品能力深度解读】连续入围Gartner魔力象限的Quick BI有何魔力?

    简介: 国际权威分析机构Gartner发布2021年商业智能和分析平台魔力象限报告,阿里云Quick BI再度入选,并继续成为该领域魔力象限唯一入选的中国企业. Quick BI凭借在增强分析能力上的 ...

  8. 后台产品的数据可视化图表产品设计

    前些天,做后台的数据子系统的时候,需要用到一些可视化的数据图表,我用到了一个自认为效果比较好,而且比较方便的方式来实现. 在网上巴拉巴拉地找了一番,目前用到这种方法来做数据图表的人并不多,我给身边的朋 ...

  9. PMCAFF微课堂 | 积木盒子产品总监 杨帆:互联网金融撮合交易的本质

    分享嘉宾:杨帆,积木盒子产品总监,连续创业者,投身金融.支付.互联网行业超过10年.第一个真正意义的银行p2p托管系统(民生银行托管系统)设计者之一,互联网金融流程和传统信贷流程结合的倡导者,互联网个 ...

最新文章

  1. IDEA上安装和使用checkstyle,findbugs,visualVM,PMD插件
  2. 腾讯面试题 TCP/IP协议四个层次
  3. 一位互联网老兵分享,社会化运营案例解析(宜信内部干货)
  4. getContentResolver().query()方法selection参数使用详解(转)
  5. 学生管理系统服务器端设计,学生信息管理系统设计与实现
  6. 今日奇葩事件,一位不懂技术,却来管理技术团队的领导
  7. OpenShift 4 - 在集群节点用crictl对Pod/Image/Container进行操作
  8. python字典数据类型笔记_python笔记--数据类型--字典
  9. Samba使用大全(转
  10. php vc14的版本,VC6_VC9_VC11_VC14的介绍PHP各版本如何选择
  11. 2021最新关于点云配准的全面综述
  12. 计算机视觉CV目标检测综述
  13. Python链家租房信息爬虫和高德地图展示
  14. 现场总线CAN和工业以太网EtherCAT详解
  15. (译)Xposed Helpers
  16. 百度 BAE 项目部署
  17. 批处理中的删除命令:del
  18. 街舞元年的角逐:“热血街舞团”和“这就是街舞”谁能胜出?
  19. 10种常用的分析模型 数据分析必看
  20. java租车_Java 哒哒租车系统(控制台)

热门文章

  1. alwayson高可用组_了解AlwaysOn可用性组上的备份-第2部分
  2. dmf nmf_SQL Server 2019 –新的DMF sys.dm_db_page_info
  3. 浅谈在基本数据包装类中使用'=='与equals的区别
  4. 线程同步 -事件Event、临界区对象CriticalSection
  5. as5 samba 图形配置
  6. CMU Database Systems - Concurrency Control Theory
  7. 2015年上海现场赛重现 (A几何, K暴力搜索)
  8. NODE安装N管理出错
  9. Java实现求二叉树的路径和
  10. [mysql]三种方法为root账户指定密码